登陆注册
9664100000021

第21章 内容的表达和元数据(5)

MPEG-7一致性和MPEG-7扩展性以及描述部分的应用仍在发展之中。前者将包括概要指导和测试MPEG-7插件一致性的过程,后者将提供摘录和选择使用MPEG-7描述工具的材料信息。

MPEG-7力图概括内容描述的全部方面,它与该领域的其他标准有联系,如EBU/P-Meta、SMPTE元数据字典以及都柏林核心。其他相关的标准还有TVAnyTime和W3C。

4.4.3SMPTE元数据字典

电影与电视工程师学会(Society of Motion Picture and Television Engineers, SMPTE)开发了SMPTE元数据字典作为一个捕获和交换元数据的标准。它强调元数据字典不是一个具体的数据模型、编目协定或者描述方案,而只是提供了一个支持系统定义的元数据标记以及元数据元素的通用标签之间的交互操作的框架。在这个框架中,各种处理元数据的组织可以将现存的方案标识在框架结构中,或者发展适合其各自需求的规定。

SMPTE元数据字典定义了特殊的类,这些类由元数据元素组成,它们有共同的特征和属性。类的组织和类中的结构是层级式的。字典中使用了通用标签概念来标识元数据元素。

元数据字典是一个动态、实时的文档,它支持定义新的输入。SMPTE扮演注册组织者的角色,即它保证了与字典的一般结构和输入唯一性的兼容,只要输入是已经注册的。描述管理流程的文档(MAP)以及工程概要指导(MEG)进一步扩充了标准。作为一个标准体系,SMPTE可以进行标准的修改和添加。

4.4.3.1元数据字典结构

元数据字典由许多章节(或者子字典)组成,每个章节又分成不同的类。

以下是定义的7种标准类:

·类1标识符和定位器,包括与用于描述全部比特流或文件素材的标识信息有关的所有元数据元素。需要特别注意的是,以单个、标准的数字方案进行素材的模糊标识,如用SMPTE UMID(见4.4.3.3)。该类也包括有关元数据元素的标识信息(称为Meta-Metadata)。子类有:全局唯一标识符(Global Unique Indentifier, GUID)、ISO标识符、对象标识符、设备标识符、唯一IPR标识符、局部定位器和标题等。

·类2管理,包括元数据表示的管理和商业信息,也包括权利信息、使用规则、加密信息和财务信息。其子类有:供应商、权利、财务信息、安全、出版输出、参与团体、播出以及重播统计数据等。

·类3翻译,由描述性信息组成,包括手动的人工生成的描述(如主题和分类),以及由自动素材分析过程检索到的信息。类3的信息用于索引、编目、管理查找和内容(或素材)的检索。翻译信息和文本描述(如内容和注解描述、脚本、关键字、分类等)以及低等级技术描述符(如配色方案、文本图、对象形状、表面特征等)共同作用。子类别包括:基本部分(如ISO语言编码、长度和时间系统)、描述部分、分类部分、赋值部分以及描述符(及其赋值或计算)。

·类4参数,包括有关镜头、传感器或系统等组成素材和元数据的技术特征的信息,素材和元数据的技术特征也是其中一部分。该类包括制作参数和原始系统设置。子类别有:视频素材编码特征、元数据编码特征、数据素材编码特征、音频素材编码特征、音频测试参数、影片播放特征、基础序列和检测、MPEG编码特征以及时码特征。

·类5处理,包括描述素材生命周期的处理过程(或者处理结果)。例如,它包括EDL参数、所有变化的审计、压缩和解压步骤记录、存储媒体和格式的变化。其子类包括:处理说明、放大器、下载流处理历史记录、调制和增强、音频处理设置以及编辑信息。

·类6相互关系,具体处理对象之间的关系,可以是对象间的关系、任何相连的素材、对象和元数据的关系。其子类包括:一般关系、相关性、素材与素材的关系、元数据与素材的关系、元数据与元数据的关系、对象与对象的关系、元数据与对象的关系以及关系结构。

·类7空间—时间,包括和与内容有关的或与原始镜头、传感器、系统有关的时间、地点、空间方面的元数据。地理空间信息定义了素材的对象、传感器、个体或其他任何组件的绝对或者相对地址。另外,该类也包括时间元素如日期、时码、同步标记、时间关键字和运动矢量参数等。其子类包括:位置和空间矢量、绝对位置、图像位置信息、位移率和方向、抽象定位、具体角度、距离测量、延迟、设置日期和时间、相关时长、绝对时间和日期、操作时间和日期以及权利时间和日期。

还有3个类,用来表示在SMPTE元数据字典中注册的组织或者试验用的元数据。这些类在字典中与以上7种类分开保存和管理。这3个类是:

·类14公众使用的组织注册,是为具体组织和个人注册的个体元素定义的。该元数据可以被发布,并且使用元数据字典的任何组织都可以使用它。类14是为组织间的个人元数据的交换而设立的,该类元数据的信息放置于元数据字典的某一章节中。它由SMPTE注册机构和SMPTE管理机构联合管理。

·类15私人使用的组织注册,包含由具体组织或个人为了内部使用而注册的元数据元素。该元数据元素本身并不是公开的,但是其元数据标签是在元数据字典中注册标识的,因此该类元素就只能让注册的组织来使用。它由SMPTE注册机构和SMPTE管理机构联合管理。

·类16试验,定义了用于多媒体检索、权限系统的元数据,以及需要新的元数据元素的试验环境。该类元素的定义和使用不需要遵守元数据字典中的定义,该类元数据只能在试验环境和实验室中使用。

4.4.3.2元数据字典元素结构

SMPTE元数据字典定义了属性、集和数据类型的集合体,被称为SMPTE通用标签,以特别标识一个元数据实体。字典定义了属性和属性集合的意义。SMPTE中还注册了(并可以发布)公共标签和属性(类14)。一个条目的标签由两部分16个字节的数值组成,该值独立于语言并且是唯一的,即元数据元素概念的通用表示。前8个字节用于第二个标志进行标引。然后数据元素标记就用来定义元数据元素(或者定义其意义),这样就以层级结构标识出了具体的元数据元素。字典中的元素名称是英文的,另外还使用英文定义了元素所代表的意义,然而这些不能限制字典的通用性。

SMPTE元数据字典指定了作为关于元数据值所需格式信息的元素类型。该定义也给出了元数据元素的边界值,值的长度定义了所允许的字节或者字符长度,它本身是可以变化的。需要重点说明的是,单个数据元素的值可以以不同方式表示,例如文本值可以以ASCII码或者Unicode值来表示。因此,这种表示需要被识别和注册。标签的最后一个值定义了正在使用的表示方式。

元数据字典以节点和叶的形式组成,字典中含有子类的不同类节点定义下一级类节点。节点由没有被赋值的标签来表示。数据元素本身由可以赋值的叶子来表示。

为了转换SMPTE元数据字典元素定义了键—长度—值策略(见4.5.1),或者也可应用XML编码(见4.5.2)。

4.4.3.3SMPTE唯一资料标识符

唯一资料标识符(Unique Material Identifier, UMID)在SMPTE元数据字典类1中有重要的地位。UMID是一个本地生成的标识符,因此它具有全局唯一性。它支持内容的明确标识。扩展的UMID(64字节)支持单帧粒度标识,是为存储和流技术的广泛应用而定义的,应可以随素材自动生成并且在其整个生命周期内保持与内容对象的关系。UMID的主要目的是定义和定位存储中的材料,支持整个制作过程中的持续标识、存储和传输、生成元数据和素材的链接。

素材和其相关元数据的共同目的是使用同一个UMID。然而,这并不意味着UMID必须是全部内容对象的唯一标识符,这对于通用的内容管理应用来说是不可行的。因为这要求内容对象只能在数据库中创建(只有在素材存在的时候,UMID对内容管理系统才是可用的,因为UMID是在素材产生时生成的)。如上所述,此时的操作有可能阻止工作流的进行。然而将UMID作为用于描述内容对象的元数据集的重要属性来存储是很好的。

UMID支持SQL技术用于素材和元数据的检索。UMID数据的表示可以分为两部分:

1.32-字节(强制)基本UMID,它包含的信息包括:

·SMPTE-UMID的通用标签标识符。

·UMID长度的长度描述。

·剪辑的副本(版本)实例数字标识。

·剪辑的材料数字标识,特殊号码。

2.32-字节(可选)签名的UMID,包含以下信息:

·时间或日期,例如制作剪辑的时间(具体到单个帧的时间)。

·镜头位置和原始剪辑的空间配合。

·制作国家的国家码。

·制作组织的组织码。

·制作人的编码。

基本UMID是在一个镜头对镜头的层面进行操作。每次生成一个新记录时,就产生一个独特的UMID加入到素材中。需要再次指出的是(很重要),UMID是自动生成的。

4.4.4都柏林核心

都柏林核心元数据向导计划组织(Dublin Core Metadata Initiative, DCMI)创立于1995年,是一个推动广泛传播的交互元数据使用标准的机构。有很多组织参加了这个协会,如Deutsche Bibliothek、国会图书馆、国家信息研究所、国家科学基金会等。DCMI发展了元数据词汇来描述资源,因此优化了信息发掘和检索。在都柏林核心(Dublin Core, DC)中的资源是有地址的实体、网络站点、文档集合以及非电子形式的媒体(如物理存储)。

DC的目标是:

·简化制作和存储素材元数据集合。

·通用语义,以支持不同用户的存取和检索。

·将元素集合翻译为各种语言,推动国际化使用。

·链接其他元数据集合的元素到DC来进行扩展。

都柏林核心在所谓的都柏林核心元数据元素集(Dublin Core Metadata Element Set, DCMES)中指定了15种元数据元素的集合。这个描述语义定义的核心集合要适合不同产业、规定和贯串组织的内容描述。

个人研究所和单个组织是不能产生新的除了15种元数据元素之外的都柏林核心元素的。都柏林核心并不限制各个领域的长度。属性/值对用于表示内容对象的特性,都柏林核心可以用不同的语义来表示,特别是用HTML和RDF/XML(使用XML的W3C资源描述框架)。

4.5元数据交换和传输的标准

为了在组织中和组织之间交换元数据,要在系统间和组织单元间对元数据进行转换。在不同系统的数据交换中,要应用不同的元数据来表示内容对象。因此,在传输中保存元数据的意义,对处理该元数据的不同实体具有参考文档或者具体的转译数据是很重要的。在上下文中,交换的准则是确保系统和组织之间的互用,因此为元数据交换定义了很多标准、传输协议和编码方案。

本节介绍的编码标准和方案都是为了便于元数据在系统间交换而定义的,然而它们的背景和考虑的主要需求是各不相同的。键—长度—值协议的目标是给出一个有效的节省存储和带宽的元数据编码协议,并且为了实现结构化内容的灵活表示和交换而定义了XML。媒体对象服务器(Media Object Server, MOS)协议是为新闻工作室环境中的信息交换特别定义的。简单对象访问协议(Simple Object Access Protocal, SOAP)是由W3C为结构化信息的传输特别定义的。以上两个协议都是基于XML的。在具体的系统环境下,了解这些协议的结构、对象和特性,从而选取适合的方法是很重要的。其他技术,如CORBA和TCP/IP协议,当然也能够用于元数据的传输,然而它们是单纯的传输协议,而元数据还是要根据定义好的元数据编码方案和标准进行编码。

4.5.1键—长度—值协议

键—长度—值(Key-Length-Value, KLV)数据编码协议是由SMPTE标准化了的为在系统间传输而对元数据元素进行编码的协议。它支持在各种传输媒体上的元数据变换,为所有应用提供了一个共享交互点。KLV考虑了SMPTE元数据字典(见4.4.3)的具体要求,而且特别为电视制作环境进行了设计。

该标准定义了使用八位字节级的数据编码(如源于字节的数据编码)来表示元数据和数据组。它使用键—长度—值三位一体,键标识数据类型,长度定义数据值长度,值指的是实际数据本身。也可以在数据集合中使用三位一体的方式。此时KLV编码用于集合的元素和集合本身。

同类推荐
  • 胡适讲国学

    胡适讲国学

    胡适先生是我国现代著名的学者。其对国学的通彻见解,让他人恐之不及。《大师讲国学文库:胡适讲国学》全面收录了胡适先生精华的国学理论,结集了多篇胡适先生在国学领域的不同文章,其内容更是涉及诸子百家、文学等多个领域,为读者更好地了解国学理论提供了很好的借鉴与参考。
  • 新媒体环境下的国际传播

    新媒体环境下的国际传播

    本书从新媒体的视域考察国际传播具有的新特征,国际传播应采取的策略以及国际传播人才的培养。重点阐述了在以博客、微博、网络电视、IPTV、手机短信、社交网络等为代表的各种新媒体手段日渐成为人们获取信息、交流信息的重要手段的环境下,国际传播应该充分发挥网络等新媒体的交互性、参与性、便捷性等特点,使国际传播的主体多元化。同时对国内外利用新媒体进行国际传播的成功及失败的案例予以剖析,对国际传播的发展趋势进行展望,为我国在新时期开展国际传播提供积极有效的参考与建议。
  • 怎么办好农民专业合作社

    怎么办好农民专业合作社

    《怎么办农民专业合作社》以其成员为主要服务对象,提供农业生产资料的购买,农产品的销售、加工、运输、贮藏以及与农业生产经营有关的技术、信息等服务。
  • 欧美公共广播电视危机与变迁研究

    欧美公共广播电视危机与变迁研究

    公共广播电视制度自80多年前在英国问世以来,深受各国政界、学界和公众的关注。与私营商业广播电视相比,公共广播电视具有抵御不良政治和商业势为侵蚀、维护公民社会和公共领域的制度特点。本书以市场化背景下欧美公共广播电视的危机与变迁为研究命题,揭示了传播制度背后的政治经济思潮和权力影响,探索了公共广播电视与国家、市场和公民社会之间的互动关系,具有明显的创新性。
  • 学科建设与研究生教育新论

    学科建设与研究生教育新论

    本书由重庆师范大学研究生处组织编写,作为重庆市研究生创新教育的理论研究成果,围绕我国及重庆市学位与研究生教育的内涵式发展,从学科建设、研究生招生、研究生教育教学改革及创新、学位管理、研究生思政建设及专业学位发展等方面,对研究生创新教育进行了系列的理论探讨。
热门推荐
  • 再生风云

    再生风云

    一名少年因病失忆,苦苦追寻真相的他,却被卷入一个无形的巨大漩涡之中……双重的身份,不一样的命运,如何取舍,成为他一生解不开的难题
  • 与你一起便是余生

    与你一起便是余生

    下一盘棋,只要下错一步,就是满盘皆输,她不怕招惹是非,只愿给他一世安好,她一步步走,走到最顶端,却被自己最爱的人拉下来。
  • 爱滴就是你

    爱滴就是你

    她,月倪,神秘的身份,双重的性格,一面冷艳无比,一面娇小可人,她到底是谁,面对突如其来的热吻,她静的像个雕塑,她到底遭遇过什么?安龙一个野性霸道,魅力四射的男人;岩风一个温柔体贴,孤傲冷血的男人.当他们相遇会擦出怎样的未来?谁都不知道,但唯一确定的是,一旦相遇注定精彩无比.
  • 苍灵衍

    苍灵衍

    苍灵木下,花开花落,缘起缘灭,生死只在一念间!
  • 豪门嫡女:腹黑毒后

    豪门嫡女:腹黑毒后

    前世被个渣男给收拾了,这一次,奇迹复活,她要那所谓的嫡姐,十倍奉还,那渣男不是不要她吗?那这一次,她就反过来,看谁斗得过谁。
  • 冷艳公主的复仇恋爱路

    冷艳公主的复仇恋爱路

    三个女孩有着开心的童年,就是因为三个女人和三个私生妹妹的介入,自己的妈妈被害死,也被赶了出来,在偶然的机会中,她们认识了,十大家族之首,他知道了她们的事情,选择送她们去死亡岛,在那之前,女孩的大姐认识了一个小男孩,那个男孩送了她一根紫色的手链,说长大后凭着手链找到她,不久她们就去了“死亡岛”在那训练了三年,三年后,她们回来了,不再是以前那个受人欺负的女孩了,自己有了公司,自从遇见了他们,对他们产生了感情,但他们的一次次的不信任伤害了她们,但她们还是选择原谅他们,因为女孩的大姐因为出车祸失去了记忆,在恢复记忆的途中,遇到了哪些事呢!我们来看看吧~
  • 杀途

    杀途

    杀手的路,终点不是你死,就是我亡。杀手本应无情,但人又怎能无情?冷血的杀手,热血的感情,杀手之路,究竟该走向何方?
  • 滚出来,臭王爷!

    滚出来,臭王爷!

    “你出来啊!冼筱婉!你有种就给我出来!别以为我不知道你在里边!快给我出来!”雪姨版的动作口吻。“我没种!”认怂的缩在门后。“你!你给我等着!”命人拿来大木桩准备破房而入。众人无语的看着这对夫妻,真是好甜蜜的一幕啊。(羡慕脸)
  • 战灵王者

    战灵王者

    这里没有绚丽的魔法,没有磅礴的斗气,没有玄妙的道术,有的只是和战灵一直战斗下的情谊,不胜则战,战之必胜的精神,扫尽天下不平,荡除天下罪恶,战灵师之使命。
  • 二次元机械武装

    二次元机械武装

    来自法利尔兰亚学院的录取通知;男主相遇奇葩女主;二次元远古生物与人类的混血种;接通二次元世界的特殊体质……二次元混血种们用他们身上的次元空间之力创造出独特的机甲,武装吧!守卫次元之门!