登陆注册
9664100000022

第22章 内容的表达和元数据(6)

4.5.1.1键—长度—值结构

KLV协议用16个字节的全局标签(Universal Label, UL)作为标识键,其后跟随给出数据值长度的数字值。键是一个全局标签,根据SMPTE 298M,开头以一个对象标识开始,紧跟着一个全局标签大小。全局标签标识以一个标识组织用的标准的编码开始,其后是SMPTE的次级标识符。接下来的字节标识符是注册的类别,如SMPTE元数据字典,6和7字节更具体地标识带有版本编号的注册和结构。在全局标签标识中,对特别条目的特殊标识由9~16字节表示。

长度部分根据基本编码规则(Basic Encoding Rules, EBR)编码。可以根据ISO标准使用长度字节的长或短的编码。数据值可以是单个数据或者数据组。

4.5.1.2KLV数据编码

单个数据的编码应用键来标识参考框架和数据类型、长度以及编码值。因为对于一个描述符有很多种字典提供了表达的方法,所以要选择用哪种方法来表示,(根据所应用的表示键)要选择一个初始的定义表示方法。备选方案在最左边字节由非零值和字典中存储的值表示。

为了支持个体数据元素的逻辑组或者使一组元素可以编码在一起,定义了分组编码方案。该编码方案可以用键单元减少冗余信息。分组编码也可以用于建立数据元素的逻辑组。KLV编码协议可以用于广义集合、全局集合、局部集合、可变长度包以及定长包。编码效率从广义集合到定长包递增,即广义集合效率最低,定长包效率最高。KLV分组编码详细介绍如下:

·广义集合,用来构建一个数据元素和其他KLV编码项目的逻辑组。在广义集合中用到了全部的KLV编码。

·全局集合,和广义集合定义方式一样,但是编码效率比广义集合要高,因为它使用共享的键头,这和原始键能够完全恢复的无压缩编码效果一样。

·局部集合,和广义集合编码方式一样,但是由于使用了简短的局部标识而有了更高的编码效率。这些标识只在局部集合中有意义,它保存了KLV数据结构的构架,但是局部标识需要有独立和具体的定义标准来定义其具体意义。同时也要定义局部标识如何映射在广义的标识键值中。

·可变长度包,用来定义为一个数据元素的深度分组(并且移除了组中所有元素的UL键和局部标识)的使用。可变长度包依赖于定义包中数据元素顺序的标准或规范。

·定长包,不仅移除了UL键和局部标识的使用,同时也去除了组中所有单个元素的长度。因此,定长包基于定义了包中数据元素的命令和每个数据元素长度的标准。这样使得定长包成为编码最有效率但也是最不灵活的数据元素编组。

集合和包是由很多KLV集合和大包数据的结构编码归组的单个数据元素组成。它们由SMPTE注册机关给予注册的广义标识键所定义。由集合编码的数据元素可能不仅仅是一个数据字典的项目,同时可能是其他包和集合的元素;而包只能编码一个数据字典中的一组单个项目,如它们不能使用循环递归编码。键的第5个字节定义了集合和包,第6字节定义了集合和包的类型。

标签是标识标签自己定义的有意义(或者值)的对象的特殊类型。因此,标签不需要长度域和值域,它们要在特殊的标签字典中被定义。

4.5.2可扩展标记语言

可扩展标记语言(eXtensible Markup Language, XML)是由W3C定义,由SGML(见3.5.2.1节)发展而来的非常灵活的文本格式。XML最初被大型电子出版业使用,现在已用于更广泛的数据范围(特别是网络)。它为数据内容定义了一个容器格式和自动验证结构,如XML描述了一个数据对象类(称为XML文档)并部分描述了计算机程序处理过程的行为。XML的设计目标是:

·在互联网上直接使用。

·支持广泛的应用。

·可以与SGML相媲美。

·优化处理XML文档的程序开发。

·最小化的可操作特征。

·XML编码文档易懂,可以方便、快速地建立。

·XML文档易被建立。

XML定义了文档建立的方式、描述了文档的结构、指定了其要包含的实体。XML文档的关键元素是标记,它以标签的方式存在,最常用的是封装文本元素的开始标签和结束标签。标签被用于结构化文档和部分文档。标签还组成实体和参数属性、描述、文档类型和XML声明,以及处理指令和内部别名。

根据标签的定义和文档类型的声明,并没有规定具体的结构,如并没有定义XML文档的具体形式、所包含元素的数量、元素的格式,以及判断一个好的XML文档的具体标准。XML1.0定义了一个文档需要包含一个或者多个元素,每个元素都由开始标签和结束标签限定。因此,它提供了一个语义框架以形成完整的能够供检索系统使用的XML文档。除了简单元素之外,XML文档还包含属性,即文档中可以赋值的实体。

如果XML文档中没有任何元素的深层定义和量化、没有元素的特征和关系、没有元素在文档中出现的次数统计以及没有给定文档结构中的指定位置,XML文档就不能被编译。因为没有参考点,所以就不能决定文档是否是完好的和有效的。另外,为了交换XML文档中的信息,有必要使所有参与的部分有着和文档内容一样的结构意义和编译方法。可以应用一个XML方案来指定XML文档元素的特征和关系以及XML文档类的属性。信息和文档的分类以及交换由具体的XML方案或者文档类型优化。这基本为特殊文档类型定义了一个框架。有很多XML方案可以用于定义XML文档类型和指定分类。最常用的是文档类型定义(Document Type Definitions, DTD)和W3C XML方案。

内容管理中重要的是不仅可以将XML应用于文档,还可以将其应用于数据流。因此,除了适合基本的文件转换以外,XML还特别适用于内容传输。

4.5.2.1文档类型定义

能够指定XML文档结构的一种形式是使用DTD。DTD是用非XML语法写成的,它描述了特定文档类型的文档结构和允许的内容。DTD基于SGML使用扩展的Bakus-Naur形式(Extended Bakus-Naur Form, EBNF)。DTD声明了XML的文档类型、元素和属性。因为它主要是定义文档的(即它的中心是文档定义而不是数据定义),所以不太支持多种数据类型。DTD只声明元素的特征数据而不指定该数据类型。因此,它不能指定数据类型的所属范围和具体元素的属性,它只给出某一个类型的文档所应该包含的结构和元素。

4.5.2.2W3C XML方案

W3C最初指定了用XML语义的XML方案,它不仅定义了XML文档和文档类型的结构,还综合了XML命名空间、结构方案、数据类型以及继承用法。W3C XML方案定义(XML Scheme Definition, XSD)的三种主要方案——XML方案第0部分:入门;XML方案第1部分:结构;XML方案第2部分:数据类型。第1部分定义了XML方案的定义语言,它用来描述XSD所定义的XML文档的结构和内容组成。第2部分描述了一些植入的、基本的数据类型(如整数、日期和二进制数据),并定义了附加数据类型用XML方案的定义语言定义的方法。XSD提供和DTD相似的元素类型声明和属性声明的机制,另外它还支持对于最大和最小出现频率的定义。

XSD和DTD最大的不同是XSD定义了数据类型列表。XSD区别了简单数据类型和推导出的数据类型。推导出的数据类型定义了由规则和列表推导出的进一步的数据类型。

除了简单数据类型,第2部分还定义了很多的推导数据类型(如规则字符串、名称、ID、长短字节等)。XSD定义的命名空间要加xsd命名空间前缀。

同类推荐
  • 美国黑人教育发展研究

    美国黑人教育发展研究

    在今天这样一个功利主义盛行、凡事都强调实用的社会里,学术研究也深受其苦、深受其害。有没有直接用途?能否直接为地方和国家经济建设服务,成为许多人判断一项学术研究是否有价值的惟一标准。因此,研究美国黑人教育史给人们带来的疑惑和惊讶可想而知,此书在申请立项资助时几经磨难的经历也证明了这一点。幸亏最终有人慧眼识珠,我们才能读到这本倾注了作者近五年心血的力作。
  • 播音主持艺术论

    播音主持艺术论

    广播电视语言传播,是现实,播音主持艺术、是现实,话筒前,镜头前的有声语言创作,也是现实,如何面对广大的受众,更是现实。我们既然有志于研究中国播音学、那就要专心致志、矢志不移地为此而一往无前、永往直前。播音界公认的继往开来的领军人物,播音主持艺术理论的学术泰斗,中国播音学学科体系的开拓者,他是国家级数学名师,他以“为人师表”而自稁,以“塑造灵魂”为自律,他为电波里,荧屏上的“名人”们培根养心……
  • 转型期中国出版业制度分析

    转型期中国出版业制度分析

    新制度经济学代表人物诺思认为,制度是决定经济长期纯净的根本因素。国际竞争说到底是制度的竞争,中国出版业要稳定快速发展并在全球市场竞争中胜出,关键要靠制度。本书以转型期中国图书出版业为研究对象,考察了政治经济和文化转型背景下的出版业转型,对三十余年来我国出版业的发展从制度层面进行了深入全面的研究,并对我国出版业制度的进一步完善 提出了见解,具有一定的理论价值殛现实意义。
  • 夏洛特·梅森家庭教育法(精典教育)

    夏洛特·梅森家庭教育法(精典教育)

    本书是作者夏洛特·梅森在经过多年的实践和研究后写成的,介绍了孩子的思维过程,使家长在教育中不断发现问题,及时有效地解决问题。书中,夏洛特·梅森提出了自己的核心观点,即培养孩子的独立性,让孩子成长为一个有发展可能性和能力的“人”,避免成为一个只会读书的书呆子。
  • 爱弥儿(经典超译本)

    爱弥儿(经典超译本)

    《爱弥儿》是一本小说体教育名著,1762年此书一出版,便轰动了法国与整个西欧,影响巨大。卢梭通过对他假设的教育对象爱弥儿的教育,表达了他从自然人性观出发的教育思想。他根据儿童的年龄提出了对不同年龄阶段的儿童进行教育的原则、内容,这些对今天的儿童教育依然有很大的借鉴作用。《经典超译本:爱弥儿》在尊重原著内容与结构的基础上,采用语录体形式,直接呈现原著中的经典段落与概括性结论,省却了繁复、冗长的论证过程。译者在领会原著者思想脉络的同时,于编译中巧妙加入了现代理解,缩小了阅读中的历史距离。行文简洁、有力,一改以往译文的晦涩拗口。
热门推荐
  • 独立学院运行与决策分析

    独立学院运行与决策分析

    《独立学院运行与决策分析》主要内容包括:独立学院的缘起、独立学院的定位问题、独立学院的产权问题、独立学院的收入与分配、独立学院人才培养模式的探索、独立学院董事会制度研究等。
  • 逆天嫡女绝世重生

    逆天嫡女绝世重生

    全世界的猎人都在捕猎三个魔神之子的时候,猎人学院的第一名唯安已经猎杀了前两个,杀了前两个后……我擦,第三个是光明神!然后,我擦!穿越了!
  • 黎明即起

    黎明即起

    曾近的我一无所有,但现在的我得到了可贵友情和一生一世的爱情。甜文!无虐!
  • 国度—白

    国度—白

    在现实社会越来越浮躁的时候,我希望写这样一部纯爱作品能够让人们知道,爱情或者是别的什么,能摆脱金钱或者欲望的东西,来到它最本质的东西,那个地方应该是不含任何杂质的。就想唐茜和楚飞最后能摆脱一切的束缚,彼此牵着手走进雪中一样,没有任何杂质,虽然我知道这好像在现实中不太可能,但是正如鲁迅先生讲的那样,我们应该呐喊,即使那声音是很微弱的,但是只要我们讲就会有希望。
  • 心之殇之镜之迷

    心之殇之镜之迷

    迷离在两个身份之间,不知道自己究竟是谁!人类和非人类,真的就不存在感情吗?太多人为了她死去或是残活在世界的某个角落,而她,又能和谁走到最后……
  • 莲修必读

    莲修必读

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 综漫之萝莉女王纯爱史

    综漫之萝莉女王纯爱史

    失去灵魂的傀儡娃娃苏醒中!化为一只无恶不作的多面派呆萌腹黑小萝莉,闯荡整个综漫界,扰乱所有的规则,打破所有人的命运。她的世界她做主,她的游戏,她布局!有人问,如果你输了怎么办?某萝莉答曰:赖!使尽各种卖萌招式,来蛊惑众多美男的芳心……特别注意:此萝莉乃易寂寞,易漏水,易消失品,要轻拿轻放,小心对待哟!【呐,如果有一天我走丢了,回不来了怎么办?】【放心,我们会一直等,等到小路痴开窍为止】
  • 福妻驾到

    福妻驾到

    现代饭店彪悍老板娘魂穿古代。不分是非的极品婆婆?三年未归生死不明的丈夫?心狠手辣的阴毒亲戚?贪婪而好色的地主老财?吃上顿没下顿的贫困宭境?不怕不怕,神仙相助,一技在手,天下我有!且看现代张悦娘,如何身带福气玩转古代,开面馆、收小弟、左纳财富,右傍美男,共绘幸福生活大好蓝图!!!!快本新书《天媒地聘》已经上架开始销售,只要3.99元即可将整本书抱回家,你还等什么哪,赶紧点击下面的直通车,享受乐乐精心为您准备的美食盛宴吧!)
  • DNF领主

    DNF领主

    雨魔著作领主主人公一穿越的形式来到了阿拉德大陆,这别为强者
  • 潜移默恋:精心布局的爱

    潜移默恋:精心布局的爱

    第一次遇见他,他是校园里众星捧月的贵公子,而她却只是刚刚考上名校的丑小鸭;第二次遇见他,他是势力滔天的名门之后,而她却只是辛苦生活的单亲妈妈;第三次遇见他,他是叱咤风云的商界传奇,而她也是翻云覆雨的后起之秀。一路走来,她的路走得艰辛无比,可是冥冥中却又好像有人在指点方向,到底是谁?她想她是恨他的,可是比恨更加深刻的又是什么呢?