登陆注册
9664100000022

第22章 内容的表达和元数据(6)

4.5.1.1键—长度—值结构

KLV协议用16个字节的全局标签(Universal Label, UL)作为标识键,其后跟随给出数据值长度的数字值。键是一个全局标签,根据SMPTE 298M,开头以一个对象标识开始,紧跟着一个全局标签大小。全局标签标识以一个标识组织用的标准的编码开始,其后是SMPTE的次级标识符。接下来的字节标识符是注册的类别,如SMPTE元数据字典,6和7字节更具体地标识带有版本编号的注册和结构。在全局标签标识中,对特别条目的特殊标识由9~16字节表示。

长度部分根据基本编码规则(Basic Encoding Rules, EBR)编码。可以根据ISO标准使用长度字节的长或短的编码。数据值可以是单个数据或者数据组。

4.5.1.2KLV数据编码

单个数据的编码应用键来标识参考框架和数据类型、长度以及编码值。因为对于一个描述符有很多种字典提供了表达的方法,所以要选择用哪种方法来表示,(根据所应用的表示键)要选择一个初始的定义表示方法。备选方案在最左边字节由非零值和字典中存储的值表示。

为了支持个体数据元素的逻辑组或者使一组元素可以编码在一起,定义了分组编码方案。该编码方案可以用键单元减少冗余信息。分组编码也可以用于建立数据元素的逻辑组。KLV编码协议可以用于广义集合、全局集合、局部集合、可变长度包以及定长包。编码效率从广义集合到定长包递增,即广义集合效率最低,定长包效率最高。KLV分组编码详细介绍如下:

·广义集合,用来构建一个数据元素和其他KLV编码项目的逻辑组。在广义集合中用到了全部的KLV编码。

·全局集合,和广义集合定义方式一样,但是编码效率比广义集合要高,因为它使用共享的键头,这和原始键能够完全恢复的无压缩编码效果一样。

·局部集合,和广义集合编码方式一样,但是由于使用了简短的局部标识而有了更高的编码效率。这些标识只在局部集合中有意义,它保存了KLV数据结构的构架,但是局部标识需要有独立和具体的定义标准来定义其具体意义。同时也要定义局部标识如何映射在广义的标识键值中。

·可变长度包,用来定义为一个数据元素的深度分组(并且移除了组中所有元素的UL键和局部标识)的使用。可变长度包依赖于定义包中数据元素顺序的标准或规范。

·定长包,不仅移除了UL键和局部标识的使用,同时也去除了组中所有单个元素的长度。因此,定长包基于定义了包中数据元素的命令和每个数据元素长度的标准。这样使得定长包成为编码最有效率但也是最不灵活的数据元素编组。

集合和包是由很多KLV集合和大包数据的结构编码归组的单个数据元素组成。它们由SMPTE注册机关给予注册的广义标识键所定义。由集合编码的数据元素可能不仅仅是一个数据字典的项目,同时可能是其他包和集合的元素;而包只能编码一个数据字典中的一组单个项目,如它们不能使用循环递归编码。键的第5个字节定义了集合和包,第6字节定义了集合和包的类型。

标签是标识标签自己定义的有意义(或者值)的对象的特殊类型。因此,标签不需要长度域和值域,它们要在特殊的标签字典中被定义。

4.5.2可扩展标记语言

可扩展标记语言(eXtensible Markup Language, XML)是由W3C定义,由SGML(见3.5.2.1节)发展而来的非常灵活的文本格式。XML最初被大型电子出版业使用,现在已用于更广泛的数据范围(特别是网络)。它为数据内容定义了一个容器格式和自动验证结构,如XML描述了一个数据对象类(称为XML文档)并部分描述了计算机程序处理过程的行为。XML的设计目标是:

·在互联网上直接使用。

·支持广泛的应用。

·可以与SGML相媲美。

·优化处理XML文档的程序开发。

·最小化的可操作特征。

·XML编码文档易懂,可以方便、快速地建立。

·XML文档易被建立。

XML定义了文档建立的方式、描述了文档的结构、指定了其要包含的实体。XML文档的关键元素是标记,它以标签的方式存在,最常用的是封装文本元素的开始标签和结束标签。标签被用于结构化文档和部分文档。标签还组成实体和参数属性、描述、文档类型和XML声明,以及处理指令和内部别名。

根据标签的定义和文档类型的声明,并没有规定具体的结构,如并没有定义XML文档的具体形式、所包含元素的数量、元素的格式,以及判断一个好的XML文档的具体标准。XML1.0定义了一个文档需要包含一个或者多个元素,每个元素都由开始标签和结束标签限定。因此,它提供了一个语义框架以形成完整的能够供检索系统使用的XML文档。除了简单元素之外,XML文档还包含属性,即文档中可以赋值的实体。

如果XML文档中没有任何元素的深层定义和量化、没有元素的特征和关系、没有元素在文档中出现的次数统计以及没有给定文档结构中的指定位置,XML文档就不能被编译。因为没有参考点,所以就不能决定文档是否是完好的和有效的。另外,为了交换XML文档中的信息,有必要使所有参与的部分有着和文档内容一样的结构意义和编译方法。可以应用一个XML方案来指定XML文档元素的特征和关系以及XML文档类的属性。信息和文档的分类以及交换由具体的XML方案或者文档类型优化。这基本为特殊文档类型定义了一个框架。有很多XML方案可以用于定义XML文档类型和指定分类。最常用的是文档类型定义(Document Type Definitions, DTD)和W3C XML方案。

内容管理中重要的是不仅可以将XML应用于文档,还可以将其应用于数据流。因此,除了适合基本的文件转换以外,XML还特别适用于内容传输。

4.5.2.1文档类型定义

能够指定XML文档结构的一种形式是使用DTD。DTD是用非XML语法写成的,它描述了特定文档类型的文档结构和允许的内容。DTD基于SGML使用扩展的Bakus-Naur形式(Extended Bakus-Naur Form, EBNF)。DTD声明了XML的文档类型、元素和属性。因为它主要是定义文档的(即它的中心是文档定义而不是数据定义),所以不太支持多种数据类型。DTD只声明元素的特征数据而不指定该数据类型。因此,它不能指定数据类型的所属范围和具体元素的属性,它只给出某一个类型的文档所应该包含的结构和元素。

4.5.2.2W3C XML方案

W3C最初指定了用XML语义的XML方案,它不仅定义了XML文档和文档类型的结构,还综合了XML命名空间、结构方案、数据类型以及继承用法。W3C XML方案定义(XML Scheme Definition, XSD)的三种主要方案——XML方案第0部分:入门;XML方案第1部分:结构;XML方案第2部分:数据类型。第1部分定义了XML方案的定义语言,它用来描述XSD所定义的XML文档的结构和内容组成。第2部分描述了一些植入的、基本的数据类型(如整数、日期和二进制数据),并定义了附加数据类型用XML方案的定义语言定义的方法。XSD提供和DTD相似的元素类型声明和属性声明的机制,另外它还支持对于最大和最小出现频率的定义。

XSD和DTD最大的不同是XSD定义了数据类型列表。XSD区别了简单数据类型和推导出的数据类型。推导出的数据类型定义了由规则和列表推导出的进一步的数据类型。

除了简单数据类型,第2部分还定义了很多的推导数据类型(如规则字符串、名称、ID、长短字节等)。XSD定义的命名空间要加xsd命名空间前缀。

同类推荐
  • 舒口水:新闻深呼吸

    舒口水:新闻深呼吸

    本书撷取的主要是新闻评论节目《新闻深呼吸》栏目的部分精彩篇章,《新闻深呼吸》由浙江经视评论员舒中胜就社会热点话题发表独特看法。
  • 广播经营战略研究正文

    广播经营战略研究正文

    本书从经营战略理论入手,深入分析了当代中国广播媒介经营中出现的一系列问题,提出了符合我国广播发展实践的经营战略。同时,对我国广播经营实践中出现的伦理冲突和道德问题进行了反思,提出了广播经营的伦理规范。本书对我国广播产业的发展具有一定的借鉴意义和参考价值,既适用于高校传媒专业师生,也可为传媒业从业人员提供指导。
  • 酷短信之爱情攻略

    酷短信之爱情攻略

    这是一套最新、最酷、最炫的沟通手册。发人深省的至理名言、幽默逗闷的搞笑专家、情意绵绵的爱情攻略、温馨感人的祝福满堂,随时随地幽默搞笑,时时处处富有哲理。轻点拇指,传递无限情谊吧!
  • 思考世界的100部学术名著(下)

    思考世界的100部学术名著(下)

    人类的历史,犹如一串华美的项链,是由无数大大小小的事件连接而成的。那一个个辉煌的瞬间,便是历史链条中璀灿的宝石与珍珠,它熠熠生辉,警示着后人。
  • 季羡林谈佛(典藏本)

    季羡林谈佛(典藏本)

    季羡林先生是国内外公认的佛教研究权威,一生对佛教研究倾注了大量的心血。季羡林从语言学、社会学、历史学等切入,修正了原来的很多假设,考证了佛教是间接传进中国来的。全书收录了季羡林先生经典的佛教研究文章,旨在反映季羡林先生重要的佛学研究成果,呈现季羡林先生在佛教研究中体现的思想和文化观。
热门推荐
  • 福妻驾到

    福妻驾到

    现代饭店彪悍老板娘魂穿古代。不分是非的极品婆婆?三年未归生死不明的丈夫?心狠手辣的阴毒亲戚?贪婪而好色的地主老财?吃上顿没下顿的贫困宭境?不怕不怕,神仙相助,一技在手,天下我有!且看现代张悦娘,如何身带福气玩转古代,开面馆、收小弟、左纳财富,右傍美男,共绘幸福生活大好蓝图!!!!快本新书《天媒地聘》已经上架开始销售,只要3.99元即可将整本书抱回家,你还等什么哪,赶紧点击下面的直通车,享受乐乐精心为您准备的美食盛宴吧!)
  • 神朽记

    神朽记

    这世上很多穿越或者重生的人,似乎每个人都有各种各样的遗憾,然而在这之前却并无办法。于是不是指望着天降奇遇,便是指望着身体变异。卓连运气不大好,没赶上奇遇,身体也没有变异,只好自己努力。
  • 半夏倾城,惹人醉

    半夏倾城,惹人醉

    “我已经记不清了,我有多久没有像现在一样站在太阳下,感受这与我久违许久的阳光……辰勋,我承认,我还是忘不了你,可,我不知道我还有没有力气去爱你……”“我已经忘了我究竟是爱你还是爱着我与你相伴的岁月……”
  • 魔神世纪之战争

    魔神世纪之战争

    远古时期,世界分为四大族。分别是人、兽、魔、神。魔族为了权利而挑起了战争。
  • 僵尸太多怪我咯

    僵尸太多怪我咯

    [想要活下来吗?只要完成这个游戏,就可以活下来……]本来是生与死的游戏,但是因为身边一个个不正常的人出现,筱枭觉得整个世界都嗨皮了!“小鸟,你这样子真是萌死了!”某妖孽蹂躏着筱枭表情淡淡的清秀脸庞,一脸愉悦的笑意。“嗯,的确萌死了。”筱枭很客气很给面子的揣向某人小鸟……“枭,你怎么前凸后翘,为什么要遮着嘛~”精致漂亮的少女眼神诡异的看着正在洗澡的筱枭,如洋娃娃的脸上撤出森森的笑意,毫不客气解开衣服飞扑上去!“姐!教我打枪!”自家弟弟什么时候这么屌丝了!游戏世界外,俊美儒雅的少年终于表情龟裂。“一群逗比!”
  • 我的女友是白富美

    我的女友是白富美

    一代绝世狂修陨落,重生到了一名性格懦弱的大学生身上。拳打校外流氓,脚踢装X二代。与此同时,成熟美丽的邻家姐姐、高不可攀的富豪千金,还有清纯可人的美丽校花、全都纷至沓来。重生后的生活,很好很邪恶……
  • 这个皇妃很欠扁

    这个皇妃很欠扁

    身为孤儿的小巧没有好好念书,很早就混迹于市井之间,吃喝嫖赌抽五毒俱全,这样的她就是一个市井小混混。小巧虽然痞子气十足,但是心地却十分善良,经常帮助其他的一些孩子,她以为自己的一生就是这样浑浑噩噩而过,没想到却遭遇了一场忽如其来的意外而死亡。身处于社会最下层的小巧一觉醒来,竟然成了相国的千金,而且还面临着进宫的命运,她会甘心于这样的命运安排吗?整个皇宫因为她的介入而鸡犬不宁,抢劫相国、殴打妃子、劫持皇上······这样的一个胆大妄为的女子要怎样玩转皇宫?那什么都不怕的性格,几乎让那个冷血的男人对她动手。
  • 翻译名义

    翻译名义

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 倾世红颜之废柴逆天三小姐

    倾世红颜之废柴逆天三小姐

    简介:她是21世纪人人闻风丧胆的鬼君孤月,冰魄银针在手,谁与争锋,一朝穿越,却成了不能修炼的废柴草包三小姐?她翻了翻白眼,勾唇一笑:“废柴?本姑娘的字典里还从没有出现过这两个字!”那什么王爷,你靠得太近了点吧!说好的女子不得近身呢?什么?对我有意思?呃,看在你长得人见人爱花见花开实力一流的份上,就给你一个插队的机会吧!
  • 青春·情感卷(读者精品)

    青春·情感卷(读者精品)

    风靡全球的真情故事,感动一生的纯美阅读;润泽心灵的饕餮盛宴,惠泽精英的成功启示;突破困局的导航明灯,缔造成功的内在密码。最纯美动人的励志佳作,无可替代的生花妙笔,展现励志美文顶尖力量,最憾动心灵的饕餮盛宴,最荡气回肠的励志大餐,最酣畅淋漓的悦读。一则则故事,催人奋进,帮你梳理纷乱的思绪,找到人生幸福的密码;一篇篇美文,怡人性情,为心灵注入勇气和力量,带给你爱和希望。一部相伴一生的心灵圣经,一掬滋润心灵的智慧甘霖,在阅读中收获真知与感动,在品味中得到启迪到智慧。