MPEG-7一致性和MPEG-7扩展性以及描述部分的应用仍在发展之中。前者将包括概要指导和测试MPEG-7插件一致性的过程,后者将提供摘录和选择使用MPEG-7描述工具的材料信息。
MPEG-7力图概括内容描述的全部方面,它与该领域的其他标准有联系,如EBU/P-Meta、SMPTE元数据字典以及都柏林核心。其他相关的标准还有TVAnyTime和W3C。
4.4.3SMPTE元数据字典
电影与电视工程师学会(Society of Motion Picture and Television Engineers, SMPTE)开发了SMPTE元数据字典作为一个捕获和交换元数据的标准。它强调元数据字典不是一个具体的数据模型、编目协定或者描述方案,而只是提供了一个支持系统定义的元数据标记以及元数据元素的通用标签之间的交互操作的框架。在这个框架中,各种处理元数据的组织可以将现存的方案标识在框架结构中,或者发展适合其各自需求的规定。
SMPTE元数据字典定义了特殊的类,这些类由元数据元素组成,它们有共同的特征和属性。类的组织和类中的结构是层级式的。字典中使用了通用标签概念来标识元数据元素。
元数据字典是一个动态、实时的文档,它支持定义新的输入。SMPTE扮演注册组织者的角色,即它保证了与字典的一般结构和输入唯一性的兼容,只要输入是已经注册的。描述管理流程的文档(MAP)以及工程概要指导(MEG)进一步扩充了标准。作为一个标准体系,SMPTE可以进行标准的修改和添加。
4.4.3.1元数据字典结构
元数据字典由许多章节(或者子字典)组成,每个章节又分成不同的类。
以下是定义的7种标准类:
·类1标识符和定位器,包括与用于描述全部比特流或文件素材的标识信息有关的所有元数据元素。需要特别注意的是,以单个、标准的数字方案进行素材的模糊标识,如用SMPTE UMID(见4.4.3.3)。该类也包括有关元数据元素的标识信息(称为Meta-Metadata)。子类有:全局唯一标识符(Global Unique Indentifier, GUID)、ISO标识符、对象标识符、设备标识符、唯一IPR标识符、局部定位器和标题等。
·类2管理,包括元数据表示的管理和商业信息,也包括权利信息、使用规则、加密信息和财务信息。其子类有:供应商、权利、财务信息、安全、出版输出、参与团体、播出以及重播统计数据等。
·类3翻译,由描述性信息组成,包括手动的人工生成的描述(如主题和分类),以及由自动素材分析过程检索到的信息。类3的信息用于索引、编目、管理查找和内容(或素材)的检索。翻译信息和文本描述(如内容和注解描述、脚本、关键字、分类等)以及低等级技术描述符(如配色方案、文本图、对象形状、表面特征等)共同作用。子类别包括:基本部分(如ISO语言编码、长度和时间系统)、描述部分、分类部分、赋值部分以及描述符(及其赋值或计算)。
·类4参数,包括有关镜头、传感器或系统等组成素材和元数据的技术特征的信息,素材和元数据的技术特征也是其中一部分。该类包括制作参数和原始系统设置。子类别有:视频素材编码特征、元数据编码特征、数据素材编码特征、音频素材编码特征、音频测试参数、影片播放特征、基础序列和检测、MPEG编码特征以及时码特征。
·类5处理,包括描述素材生命周期的处理过程(或者处理结果)。例如,它包括EDL参数、所有变化的审计、压缩和解压步骤记录、存储媒体和格式的变化。其子类包括:处理说明、放大器、下载流处理历史记录、调制和增强、音频处理设置以及编辑信息。
·类6相互关系,具体处理对象之间的关系,可以是对象间的关系、任何相连的素材、对象和元数据的关系。其子类包括:一般关系、相关性、素材与素材的关系、元数据与素材的关系、元数据与元数据的关系、对象与对象的关系、元数据与对象的关系以及关系结构。
·类7空间—时间,包括和与内容有关的或与原始镜头、传感器、系统有关的时间、地点、空间方面的元数据。地理空间信息定义了素材的对象、传感器、个体或其他任何组件的绝对或者相对地址。另外,该类也包括时间元素如日期、时码、同步标记、时间关键字和运动矢量参数等。其子类包括:位置和空间矢量、绝对位置、图像位置信息、位移率和方向、抽象定位、具体角度、距离测量、延迟、设置日期和时间、相关时长、绝对时间和日期、操作时间和日期以及权利时间和日期。
还有3个类,用来表示在SMPTE元数据字典中注册的组织或者试验用的元数据。这些类在字典中与以上7种类分开保存和管理。这3个类是:
·类14公众使用的组织注册,是为具体组织和个人注册的个体元素定义的。该元数据可以被发布,并且使用元数据字典的任何组织都可以使用它。类14是为组织间的个人元数据的交换而设立的,该类元数据的信息放置于元数据字典的某一章节中。它由SMPTE注册机构和SMPTE管理机构联合管理。
·类15私人使用的组织注册,包含由具体组织或个人为了内部使用而注册的元数据元素。该元数据元素本身并不是公开的,但是其元数据标签是在元数据字典中注册标识的,因此该类元素就只能让注册的组织来使用。它由SMPTE注册机构和SMPTE管理机构联合管理。
·类16试验,定义了用于多媒体检索、权限系统的元数据,以及需要新的元数据元素的试验环境。该类元素的定义和使用不需要遵守元数据字典中的定义,该类元数据只能在试验环境和实验室中使用。
4.4.3.2元数据字典元素结构
SMPTE元数据字典定义了属性、集和数据类型的集合体,被称为SMPTE通用标签,以特别标识一个元数据实体。字典定义了属性和属性集合的意义。SMPTE中还注册了(并可以发布)公共标签和属性(类14)。一个条目的标签由两部分16个字节的数值组成,该值独立于语言并且是唯一的,即元数据元素概念的通用表示。前8个字节用于第二个标志进行标引。然后数据元素标记就用来定义元数据元素(或者定义其意义),这样就以层级结构标识出了具体的元数据元素。字典中的元素名称是英文的,另外还使用英文定义了元素所代表的意义,然而这些不能限制字典的通用性。
SMPTE元数据字典指定了作为关于元数据值所需格式信息的元素类型。该定义也给出了元数据元素的边界值,值的长度定义了所允许的字节或者字符长度,它本身是可以变化的。需要重点说明的是,单个数据元素的值可以以不同方式表示,例如文本值可以以ASCII码或者Unicode值来表示。因此,这种表示需要被识别和注册。标签的最后一个值定义了正在使用的表示方式。
元数据字典以节点和叶的形式组成,字典中含有子类的不同类节点定义下一级类节点。节点由没有被赋值的标签来表示。数据元素本身由可以赋值的叶子来表示。
为了转换SMPTE元数据字典元素定义了键—长度—值策略(见4.5.1),或者也可应用XML编码(见4.5.2)。
4.4.3.3SMPTE唯一资料标识符
唯一资料标识符(Unique Material Identifier, UMID)在SMPTE元数据字典类1中有重要的地位。UMID是一个本地生成的标识符,因此它具有全局唯一性。它支持内容的明确标识。扩展的UMID(64字节)支持单帧粒度标识,是为存储和流技术的广泛应用而定义的,应可以随素材自动生成并且在其整个生命周期内保持与内容对象的关系。UMID的主要目的是定义和定位存储中的材料,支持整个制作过程中的持续标识、存储和传输、生成元数据和素材的链接。
素材和其相关元数据的共同目的是使用同一个UMID。然而,这并不意味着UMID必须是全部内容对象的唯一标识符,这对于通用的内容管理应用来说是不可行的。因为这要求内容对象只能在数据库中创建(只有在素材存在的时候,UMID对内容管理系统才是可用的,因为UMID是在素材产生时生成的)。如上所述,此时的操作有可能阻止工作流的进行。然而将UMID作为用于描述内容对象的元数据集的重要属性来存储是很好的。
UMID支持SQL技术用于素材和元数据的检索。UMID数据的表示可以分为两部分:
1.32-字节(强制)基本UMID,它包含的信息包括:
·SMPTE-UMID的通用标签标识符。
·UMID长度的长度描述。
·剪辑的副本(版本)实例数字标识。
·剪辑的材料数字标识,特殊号码。
2.32-字节(可选)签名的UMID,包含以下信息:
·时间或日期,例如制作剪辑的时间(具体到单个帧的时间)。
·镜头位置和原始剪辑的空间配合。
·制作国家的国家码。
·制作组织的组织码。
·制作人的编码。
基本UMID是在一个镜头对镜头的层面进行操作。每次生成一个新记录时,就产生一个独特的UMID加入到素材中。需要再次指出的是(很重要),UMID是自动生成的。
4.4.4都柏林核心
都柏林核心元数据向导计划组织(Dublin Core Metadata Initiative, DCMI)创立于1995年,是一个推动广泛传播的交互元数据使用标准的机构。有很多组织参加了这个协会,如Deutsche Bibliothek、国会图书馆、国家信息研究所、国家科学基金会等。DCMI发展了元数据词汇来描述资源,因此优化了信息发掘和检索。在都柏林核心(Dublin Core, DC)中的资源是有地址的实体、网络站点、文档集合以及非电子形式的媒体(如物理存储)。
DC的目标是:
·简化制作和存储素材元数据集合。
·通用语义,以支持不同用户的存取和检索。
·将元素集合翻译为各种语言,推动国际化使用。
·链接其他元数据集合的元素到DC来进行扩展。
都柏林核心在所谓的都柏林核心元数据元素集(Dublin Core Metadata Element Set, DCMES)中指定了15种元数据元素的集合。这个描述语义定义的核心集合要适合不同产业、规定和贯串组织的内容描述。
个人研究所和单个组织是不能产生新的除了15种元数据元素之外的都柏林核心元素的。都柏林核心并不限制各个领域的长度。属性/值对用于表示内容对象的特性,都柏林核心可以用不同的语义来表示,特别是用HTML和RDF/XML(使用XML的W3C资源描述框架)。
4.5元数据交换和传输的标准
为了在组织中和组织之间交换元数据,要在系统间和组织单元间对元数据进行转换。在不同系统的数据交换中,要应用不同的元数据来表示内容对象。因此,在传输中保存元数据的意义,对处理该元数据的不同实体具有参考文档或者具体的转译数据是很重要的。在上下文中,交换的准则是确保系统和组织之间的互用,因此为元数据交换定义了很多标准、传输协议和编码方案。
本节介绍的编码标准和方案都是为了便于元数据在系统间交换而定义的,然而它们的背景和考虑的主要需求是各不相同的。键—长度—值协议的目标是给出一个有效的节省存储和带宽的元数据编码协议,并且为了实现结构化内容的灵活表示和交换而定义了XML。媒体对象服务器(Media Object Server, MOS)协议是为新闻工作室环境中的信息交换特别定义的。简单对象访问协议(Simple Object Access Protocal, SOAP)是由W3C为结构化信息的传输特别定义的。以上两个协议都是基于XML的。在具体的系统环境下,了解这些协议的结构、对象和特性,从而选取适合的方法是很重要的。其他技术,如CORBA和TCP/IP协议,当然也能够用于元数据的传输,然而它们是单纯的传输协议,而元数据还是要根据定义好的元数据编码方案和标准进行编码。
4.5.1键—长度—值协议
键—长度—值(Key-Length-Value, KLV)数据编码协议是由SMPTE标准化了的为在系统间传输而对元数据元素进行编码的协议。它支持在各种传输媒体上的元数据变换,为所有应用提供了一个共享交互点。KLV考虑了SMPTE元数据字典(见4.4.3)的具体要求,而且特别为电视制作环境进行了设计。
该标准定义了使用八位字节级的数据编码(如源于字节的数据编码)来表示元数据和数据组。它使用键—长度—值三位一体,键标识数据类型,长度定义数据值长度,值指的是实际数据本身。也可以在数据集合中使用三位一体的方式。此时KLV编码用于集合的元素和集合本身。