登陆注册
9664100000022

第22章 内容的表达和元数据(6)

4.5.1.1键—长度—值结构

KLV协议用16个字节的全局标签(Universal Label, UL)作为标识键,其后跟随给出数据值长度的数字值。键是一个全局标签,根据SMPTE 298M,开头以一个对象标识开始,紧跟着一个全局标签大小。全局标签标识以一个标识组织用的标准的编码开始,其后是SMPTE的次级标识符。接下来的字节标识符是注册的类别,如SMPTE元数据字典,6和7字节更具体地标识带有版本编号的注册和结构。在全局标签标识中,对特别条目的特殊标识由9~16字节表示。

长度部分根据基本编码规则(Basic Encoding Rules, EBR)编码。可以根据ISO标准使用长度字节的长或短的编码。数据值可以是单个数据或者数据组。

4.5.1.2KLV数据编码

单个数据的编码应用键来标识参考框架和数据类型、长度以及编码值。因为对于一个描述符有很多种字典提供了表达的方法,所以要选择用哪种方法来表示,(根据所应用的表示键)要选择一个初始的定义表示方法。备选方案在最左边字节由非零值和字典中存储的值表示。

为了支持个体数据元素的逻辑组或者使一组元素可以编码在一起,定义了分组编码方案。该编码方案可以用键单元减少冗余信息。分组编码也可以用于建立数据元素的逻辑组。KLV编码协议可以用于广义集合、全局集合、局部集合、可变长度包以及定长包。编码效率从广义集合到定长包递增,即广义集合效率最低,定长包效率最高。KLV分组编码详细介绍如下:

·广义集合,用来构建一个数据元素和其他KLV编码项目的逻辑组。在广义集合中用到了全部的KLV编码。

·全局集合,和广义集合定义方式一样,但是编码效率比广义集合要高,因为它使用共享的键头,这和原始键能够完全恢复的无压缩编码效果一样。

·局部集合,和广义集合编码方式一样,但是由于使用了简短的局部标识而有了更高的编码效率。这些标识只在局部集合中有意义,它保存了KLV数据结构的构架,但是局部标识需要有独立和具体的定义标准来定义其具体意义。同时也要定义局部标识如何映射在广义的标识键值中。

·可变长度包,用来定义为一个数据元素的深度分组(并且移除了组中所有元素的UL键和局部标识)的使用。可变长度包依赖于定义包中数据元素顺序的标准或规范。

·定长包,不仅移除了UL键和局部标识的使用,同时也去除了组中所有单个元素的长度。因此,定长包基于定义了包中数据元素的命令和每个数据元素长度的标准。这样使得定长包成为编码最有效率但也是最不灵活的数据元素编组。

集合和包是由很多KLV集合和大包数据的结构编码归组的单个数据元素组成。它们由SMPTE注册机关给予注册的广义标识键所定义。由集合编码的数据元素可能不仅仅是一个数据字典的项目,同时可能是其他包和集合的元素;而包只能编码一个数据字典中的一组单个项目,如它们不能使用循环递归编码。键的第5个字节定义了集合和包,第6字节定义了集合和包的类型。

标签是标识标签自己定义的有意义(或者值)的对象的特殊类型。因此,标签不需要长度域和值域,它们要在特殊的标签字典中被定义。

4.5.2可扩展标记语言

可扩展标记语言(eXtensible Markup Language, XML)是由W3C定义,由SGML(见3.5.2.1节)发展而来的非常灵活的文本格式。XML最初被大型电子出版业使用,现在已用于更广泛的数据范围(特别是网络)。它为数据内容定义了一个容器格式和自动验证结构,如XML描述了一个数据对象类(称为XML文档)并部分描述了计算机程序处理过程的行为。XML的设计目标是:

·在互联网上直接使用。

·支持广泛的应用。

·可以与SGML相媲美。

·优化处理XML文档的程序开发。

·最小化的可操作特征。

·XML编码文档易懂,可以方便、快速地建立。

·XML文档易被建立。

XML定义了文档建立的方式、描述了文档的结构、指定了其要包含的实体。XML文档的关键元素是标记,它以标签的方式存在,最常用的是封装文本元素的开始标签和结束标签。标签被用于结构化文档和部分文档。标签还组成实体和参数属性、描述、文档类型和XML声明,以及处理指令和内部别名。

根据标签的定义和文档类型的声明,并没有规定具体的结构,如并没有定义XML文档的具体形式、所包含元素的数量、元素的格式,以及判断一个好的XML文档的具体标准。XML1.0定义了一个文档需要包含一个或者多个元素,每个元素都由开始标签和结束标签限定。因此,它提供了一个语义框架以形成完整的能够供检索系统使用的XML文档。除了简单元素之外,XML文档还包含属性,即文档中可以赋值的实体。

如果XML文档中没有任何元素的深层定义和量化、没有元素的特征和关系、没有元素在文档中出现的次数统计以及没有给定文档结构中的指定位置,XML文档就不能被编译。因为没有参考点,所以就不能决定文档是否是完好的和有效的。另外,为了交换XML文档中的信息,有必要使所有参与的部分有着和文档内容一样的结构意义和编译方法。可以应用一个XML方案来指定XML文档元素的特征和关系以及XML文档类的属性。信息和文档的分类以及交换由具体的XML方案或者文档类型优化。这基本为特殊文档类型定义了一个框架。有很多XML方案可以用于定义XML文档类型和指定分类。最常用的是文档类型定义(Document Type Definitions, DTD)和W3C XML方案。

内容管理中重要的是不仅可以将XML应用于文档,还可以将其应用于数据流。因此,除了适合基本的文件转换以外,XML还特别适用于内容传输。

4.5.2.1文档类型定义

能够指定XML文档结构的一种形式是使用DTD。DTD是用非XML语法写成的,它描述了特定文档类型的文档结构和允许的内容。DTD基于SGML使用扩展的Bakus-Naur形式(Extended Bakus-Naur Form, EBNF)。DTD声明了XML的文档类型、元素和属性。因为它主要是定义文档的(即它的中心是文档定义而不是数据定义),所以不太支持多种数据类型。DTD只声明元素的特征数据而不指定该数据类型。因此,它不能指定数据类型的所属范围和具体元素的属性,它只给出某一个类型的文档所应该包含的结构和元素。

4.5.2.2W3C XML方案

W3C最初指定了用XML语义的XML方案,它不仅定义了XML文档和文档类型的结构,还综合了XML命名空间、结构方案、数据类型以及继承用法。W3C XML方案定义(XML Scheme Definition, XSD)的三种主要方案——XML方案第0部分:入门;XML方案第1部分:结构;XML方案第2部分:数据类型。第1部分定义了XML方案的定义语言,它用来描述XSD所定义的XML文档的结构和内容组成。第2部分描述了一些植入的、基本的数据类型(如整数、日期和二进制数据),并定义了附加数据类型用XML方案的定义语言定义的方法。XSD提供和DTD相似的元素类型声明和属性声明的机制,另外它还支持对于最大和最小出现频率的定义。

XSD和DTD最大的不同是XSD定义了数据类型列表。XSD区别了简单数据类型和推导出的数据类型。推导出的数据类型定义了由规则和列表推导出的进一步的数据类型。

除了简单数据类型,第2部分还定义了很多的推导数据类型(如规则字符串、名称、ID、长短字节等)。XSD定义的命名空间要加xsd命名空间前缀。

同类推荐
  • 微风无限:微时代娱乐景观管窥(“微时代漫步”系列丛书)

    微风无限:微时代娱乐景观管窥(“微时代漫步”系列丛书)

    “微”风所向,无限精彩;本书以“微文化”的精神流脉为纲,以“微娱乐”的发展肌理为目,引领读者管窥一个异彩纷呈的“微家族”。
  • 周有光百岁隽语

    周有光百岁隽语

    周有光先生一生工作有三个阶段:五十岁前是金融工作,期间也教书;五十岁后,是语言文字工作;八十五岁之后是研究人类史、文化史、文明史。三个阶段一以贯之的理念是:“语言使人类有别于禽兽,文字使文明有别于野蛮,教育使进步有别于落后。”这三句话可说是他生命的纲领,核心是启蒙。而作为启蒙思想家,第三阶段无疑是最亮的亮点。因为,还在延续的第三阶段,老先生已经达到了横扫中外,贯通今古的境界,并且仍在扩展和提升。他的历经前清、北伐前民国、北伐后民国、人民共和国的丰富的人生经历,他的百科全书式的厚重的知识结构,加上惊人的终身学习的毅力和效果,经过疏理、锤炼、融合、升华,使他当之无愧,成为当代最杰出的启蒙思想家。
  • 诸子人才观与现代人才学

    诸子人才观与现代人才学

    《诸子百家与现代文化》一书概括了诸子百家符合社会发展需要的哲学性认识,努力探索先秦诸子学说中规律性的见解,一分为二地评介其为人处世的原则,实事求是地介绍了诸子认识事物的方法和建功立业的方略。该书体现了中国传统文化的精华,集中反映了人生哲理与智慧的结晶,对于提高人们的精神文明和思想文化素质有重要意义。
  • 受众反拨与媒介变局:党报群众工作的理论与实践

    受众反拨与媒介变局:党报群众工作的理论与实践

    本书从党报所处的发展环境入手,全面分析党报群众工作的历史经验及现实意义,探究党报群众工作的现实问题,有针对性地提出党报群众工作的改进思路。
  • 永恒的中国心

    永恒的中国心

    吴大观同志是中国航空发动机事业的开拓者和奠基人,是品德高尚、报国有成的党员专家。2009年7月,中共中央组织部做出决定,追授吴大观同志“全国优秀共产党员”称号。之后,中央组织部、中央宣传部、中央深入学习实践科学发展观活动领导小组、国资委党委联合下发了《关于开展向吴大观同志学习的通知》,要求在广大党员干部中深入开展向吴大观同志学习的活动。吴大观同志还光荣当选“100位新中国成立以来感动中国人物”。本书收集了吴大观同志先进事迹报告会的演讲稿及中央、地方媒体对吴大观同志先进事迹的各类报道,对吴大观同志的先进事迹、高尚品德和崇高精神进行了详尽介绍和深入挖掘,是学习吴大观同志先进事迹的生动教材。
热门推荐
  • 灵异聊天室

    灵异聊天室

    苏漠是一家出版公司的作家,工作努力,却做不出什么好成绩。为了能写出好的灵异作品,她开始在聊天室里向聊友搜集题材。起初,她总是出现一些幻听幻象,她认为只是压力过大导致的精神错乱。她的男友冷轩陪同她去医院接受各种治疗,最后确诊为“分身幻想症”,她不愿承认自己是个病人,离家出走......待她清醒时,发现生活中的一切都与之前大相径庭......苏漠的作品《灵异聊天室》一出版就成为畅销品,她的努力终于得到了肯定。一位姑娘坐在窗前,聊到深夜,她感到口干舌燥。“好了,这就是我要给大家讲的‘灵异聊天室’的故事。时间不早了,大家早点睡吧?”苏漠下了线,摘下耳机,向沙发上白面獠牙的男子走去......
  • 幻灵少女

    幻灵少女

    在这本书中,女主角“盏玿”是从幻灵世界穿越来的最小公主,她的父王为护她周全,耗尽最后一点灵力把她传送到了人类世界,在人类世界里,有许许多多的不得已,然而,她必须硬着头皮去面对,她和自己的几位好友经历了许多……
  • 霸道校草的小巫婆

    霸道校草的小巫婆

    不轻易的爬到了他的车上,就要她李若璇死定。在开学第一天,又遇到他,还成为他的未婚妻,没想到他居然是高氏集团的继承人‘天,死都没想到遇到这样一人’李若璇的日子不好过了。。。。
  • 黎明的帷幕

    黎明的帷幕

    试曾幻想,即使没有鲜血染红的大地这世界依旧恐惧黑暗倘若失去了信念的光芒我们这些平凡之人,又该何去何从?
  • 美女总裁的王者佣兵

    美女总裁的王者佣兵

    华夏国传说有这样一支神秘部队,被称为最强特种部队,他的名字叫做锋刃特战部队。传说每一个国家交代的任务,都会顺利完成,就这样,锋刃特战部队成为了一个神一样的存在。好景不长,在一次剿杀国际最大杀手组织暗影佣兵集团的时候,意外发生了,锋刃特战队队长和副队长在任务中深入敌后作战,不幸身亡。……………………几年后!国际最大杀手组织暗影佣兵集团突然出现了一个强大的对手,被称为裁决军团。传说其领导者被称为鬼神。像鬼一样来无影去无踪。然而我们的主角萧梓宇在老头子的提示下,找到了自己小时候的娃娃亲总裁。林晨曦,美女校花,性感警花,泼辣搏击女。看主角如何一一收服。
  • 情人的:眼泪

    情人的:眼泪

    《情人的眼泪》是一部言情小说,女主人公原本生活在美好的异度空间,与精灵为舞,和光明为伴。为了追寻爱情,失去了力量的源泉“生命之水”,降生在了东北的一个小村庄。她深爱的情人决定找到他,带着他们的“生命之水”和前世的记忆降生到北京。机缘让他们在北京相遇,虽近在咫尺,却阴差阳错。二人在地球上经历了哪些波折和磨难,感受了哪些人间冷暖、世态炎凉。。。故事采用了真实与科幻、现实与理想的叙事手法,情节跌宕起伏,他们的命运将何去何从呢?!……。。。
  • Queen的转身

    Queen的转身

    她,若黑暗中的死神,为复仇而来,踏复仇而去,只不过前一次为了他的仇恨,后一次是对自己的仇,恨自己爱上了一个自己恨的人,他,是万千灯火的不败之仙,为爱她而来,至死不休。每一份的爱又承载多少的恨?爱恨交错他们又该何去何从?
  • 天使街的99号

    天使街的99号

    因为一件发生在很久以前的事情。天使街小区和九十九号小区的人就反目成仇。开始攀比无论是衣食住行,还是人才。今年两个小区都有了自己的代表人物。明明是要斗智斗勇,相互攀比的。为什么....她看着他,忽然就有了一种心动的感觉。
  • 玉照神应真经

    玉照神应真经

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 地球死亡日

    地球死亡日

    垃圾山上,少年负手而立,仰望苍天:“吾空有凌云壮志,奈何天道不公,时不与我。”话音刚落一阵地动山摇,奇迹出现了...详情请看地球死亡日有任何问题请在书评留言谢谢大家的支持