登陆注册
9664100000023

第23章 内容的表达和元数据(7)

4.5.2.3XML处理

XML的一个重要方面是能够自动被解析和处理,而且还包含控制计算机上处理和执行命令的指令。查询处理对检索内容对象的信息很重要。链接被用来提供关于XML数据项目设置的关系信息。检索和链接是两个处理复杂信息的基本处理过程。定义特殊的XML链接语言(XML Linking Language, XLink)允许在XML文档中插入元素,它们可以被应用于生成和描述资源之间的链接。XLink提供的链接功能是根据全局属性定义的,它可以从其他命名空间链接到链接元素上。XLink和资源(即有地址的信息单元或者服务)相联系,链接从一个开始资源转换到一个结束资源。所谓的弧提供了转换链接的信息(如方向),它区别了简单链接(提供与HTML相似的超级链接功能)和扩展链接。在扩展链接中,其元素可以存储于有扩展属性的元素中,可能有加入链接的扩展源的专用号码。

XML路径语言(XML Path Language, XPath)通过指定XML文档的地址来定义XML结构的检索和转换,它提供对字符、数字和布尔计算的基本操作。根据XPath,XML文档由层级节点构成,节点树的根节点表示文档实体。树节点有不同类型,包括元素节点、属性节点和文本节点。XPath定义了一种为不同节点类型计算字符串数值的方法。

检索由根节点开始,根据XPath给出的方向进行。检索在文档的抽象逻辑结构上进行而不是在表面语义上。匹配模式的功能在检索过程中很重要(如检测节点是否符合某一个模式)。

除了XPath,还定义了XML查询语言(XML Query Language, XQuery)以支持存储在XML文档中的查询操作。XQuery用于不满足关系模型的文档,并能动态创建文档。XQuery使用的查询语言要能够用XML语法表示。

4.5.2.4XML和元数据

XML及其扩展提供了强大的构建结构和处理元数据的概念和工具。然而,XML并没有提供数据模型或者元数据参考模型。为了使用XML来处理和交换元数据,就需要定义这些模型,以MPEG-7为例,它使用了XSD的扩展版本。因此,定义了资源描述框架(Resource Deion Framework, RDF)用来表示有关万维网上的资源、简化交换、文档翻译以及元数据。RDF是一个描述任何因特网资源如一个网站和它的内容的普通框架,它提供了通用的框架来表示该类信息,但是没有定义词汇和描述参数(如标题和作者),它还指定了用于名称和描述参数的机器语言以及其描述的资源的类。都柏林核心是RDF应用于具体元数据模型的一个领域。

在XML中,信息可以被灵活编码,但对于元数据的交换和翻译还不够。这就要求具体的XML方案、描述框架以及能够用于编码信息参考的元数据参考模型。只有当XML、XML方案描述框架以及能够用于编码信息参考的元数据参考模型等系统同时应用时,才能进行这些系统之间元数据的交换。

4.5.3媒体对象服务器协议

媒体对象服务器(Media Object Server, MOS)协议是由联合印刷组织(Associated Press, AP)领导的工业联盟促使开发的。联合印刷组织的新闻工作室系统ENPS参与了MOS的联合制定工作。联盟的成员主要是参与广播系统的公司,其目的是发展一种开放式的工业标准以支持媒体制作,特别是新闻的制作及系统的整合。这样的系统包括:视频服务器、新闻工作室系统、自动演播室系统和内容管理系统。

该协议基本上是一个标记过的数据流,它指定了一个分类后完全定义好的XML消息集合,用来在MOS相关系统中交换信息。每个MOS消息以一个根标记“mos”开始,之后是ID和消息类型。其后面的数据也是标记的类型。除了定义消息类型之外,为了附加信息的交换,协议也支持XML标记的附加值。数据标记是英文格式,同时带有可以包含其他语言的描述性数据字段。对象描述限制于Unicode UCS-2文本,格式文本在非结构化的描述领域中是不被支持的。

MOS消息在新闻工作室控制系统(Newsroom Control System, NCS)和媒体对象服务器(MOS)之间以无方向的模式交换。消息必须被确认,设备在没有接到正或者负的确认信号时不能发送下一个消息。为了支持两个系统的双向通信,两个系统都需要添加NCS和MOS服务器。在NCS和MOS之间采用TCP/IP协议传输消息。

MOS协议概括了制作系统中信息交换的很具体的需求集合。它提供了一些可扩展的基本子集,但是并没有偏离(新闻)制作领域的需求。

4.5.4简单对象访问协议

简单对象访问协议(Simple Object Access Protocol, SOAP)是由W3C负责标准化的。它是交换结构化信息的轻量级协议,特别是在非集中的分布式环境中。SOAP最初考虑了网络服务,网络服务是可以使用标准互联网络协议和技术进行存取的互联网服务(如HTTP、XML、SMTP等)。SOAP已经成为在应用程序之间传递消息的标准化协议,它使用XML技术定义可扩展的消息框架。SOAP独立于其他任何程序模型和特殊句法。该协议本身并不处理如可靠性、安全性和路由等问题。SOAP使用简单的基于XML的消息存取,支持独立于系统和平台的信息交换。

SOAP标准指定了基于XML的信息交换信封格式和一系列规则,这些规则规定了如何用XML来表示应用程序和平台的数据类型。该信封包含一个可选的头和一个(唯一)主体。头由一个或者多个包含消息处理的信息块构成(包括路由和传递设置、认证信息和事务环境)。消息主体包括用XML语义编码的实际消息,它可以含有所需的尽可能多的子节点。XML消息必须结构良好、限定命名空间,它不应该含有任何处理指令和DTD引用。

SOAP支持两种基本的消息交换,称为请求响应消息和单向通知消息。前者用于远程过程调用(Remote Procedure Call, RPC),而后者用于文档传输等应用。对于RPC类的消息,呼叫方法以一个带参数模型的结构来表示,响应信息也模型化为一个单个结构,其中每个返回参数都有一个域,按照惯例响应信息以附带调用的方法命名。

SOAP交换模型的核心是一个由发送方到接收方的单向封装的传输。消息路径的中间系统在消息从发送方到接收方的单向传输过程中处理消息。然而,SOAP并没有指定路径本身和参数标准,比如提出用微软的WS-Routing协议建立消息路径。

SOAP标准的第五部分规定的编码风格定义了应用程序(可能在不同平台下)之间如何通讯,尽管它们的数据类型和表示方式也许不同。这些编码规则是可选的,是可以为事先不知道交换信息类型时的信息交换而定义的,此时有两个重要的概念:值和访问器。值表示了单个数据单元或者在同一个XML标签中的数据单元的组合。访问器是一个和值有关的元素。这种关系可以是直接的(同在多引用的访问器中一样)也可以是通过ID的。访问器的数据类型可以由三种方法确定:通过引用XML方案确定数据类型、通过引用XML方案文档为具体元素定义的数据类型、通过引用其他方案文档。XML方案数据类型由SOAP支持。尽管SOAP被称为对象协议,但它并没有对象和对象参数的概念,SOAP的编码规则指定了怎样在XML中表示对象。

作为一个封装协议,SOAP使用传输协议进行消息传送。此时使用的协议有HTTP、FTP、TCP、SMPT、POP3等,因此传输SOAP消息有很多种方法。然而,因为是处在网络环境中的关系,HTTP是目前传输SOAP消息使用最广泛的协议。将SOPA消息映射成HTTP时特别考虑了SOAP的定义,因为HTTP是一个基于请求响应模式的协议,所以SOAP到HTTP需要自然的匹配。SOAP的定义说明了SOAP消息交换模型如何以HTTP形式来表示,例如,SOAP Action的HTTP头在SOAP中进行定义,这表明SOAP HTTP请求的目标。但是将SOAP映射为HTTP时还有其他的问题要考虑,其中之一是使用80端口(HTTP最常使用的端口)的安全问题。另外,还要考虑到错误处理和递送等问题。

同类推荐
  • 传媒观察:危机与转机

    传媒观察:危机与转机

    在新中国成立60周年、中国传媒大学校庆55周年之际,《现代传播——中国传媒大学学报》也迎来了30周年刊庆。《现代传播——中国传媒大学学报》创刊于1979年,迄今走过了整整30年的历程。作为国内创刊最早的广播电视学术期刊之一,30年来我们向广大读者奉献了160多期刊物,5000余篇论文,发行总量50万余册,为中国广播电视学术与事业的发展做出了自己的贡献。
  • 数字未来与媒介社会2011(2)

    数字未来与媒介社会2011(2)

    本书集结2011年学术界在“数字未来与媒介社会”方面的优秀论述,话题涉及传播技术研究、传播理论研究、传播艺术研究、传播实务研究等。
  • 中国文学发展概论

    中国文学发展概论

    本书主要从中国古代文学发展概论、中国近代文学发展概论和中国现代文学发展概论来总结中国文学发展。 优秀的文学作品能使人产生如临其境、如见其人、如闻其声的感觉,并从思想感情上受到感染、教育和陶冶。文学是语言的艺术,是以语言为工具来塑造艺术形象的,虽然其具有形象的间接性,但它能多方面立体性地展示社会生活,甚至表现社会生活的发展过程,展示人与人之间的错综复杂的社会关系和人物的内心精神世界。
  • 让课堂充满幽默

    让课堂充满幽默

    本书较全面地介绍了幽默教育的理论和方法,包括从幽默教育的理论修养到各具体学科课堂教学的机智应变,并提供了许多可供直接引用的幽默素材撷英。本书案例丰富、幽默风趣,可悦读,可操作,可模仿,可会心一笑,可掩卷深思,是新教师自我提升的案头书、教学艺术培训的参考书。
  • 中华句典4

    中华句典4

    中华文化博大精深,汉语文字奥妙无穷。悠远的历史为我们创造出了鲜活精彩的语言和文字,每一个字、每一句话都是一个故事,都牵动着华夏文明的神经。本书共收录名言警句、歇后语、谜语、对联、俗语、谚语等上万条。这些鲜活的语言文字语简意赅,大多经过千锤百炼,代代相传,才流传至今。这些语句,或寓意深长,或幽默风趣,有着过目难忘的艺术效果。本书以句句的实用性、典型性和广泛性为着眼点进行编排,所选的句句时间跨度相当大,从先秦时期的重要著作,到当代名人的智慧言语均有涉及;所选的名句范围非常广,从诗词曲赋、小说杂记等文学体裁,到俗谚、歇后语、谜语等民间文学都有涉猎。
热门推荐
  • 王国英雄传—红莲业火

    王国英雄传—红莲业火

    王国历107年,一座地处诺伦丁王国东南部的矿山发生崩塌,这究竟是一起简单的事故还是蓄谋已久的计划,看似平静的大陆又将经历怎样的风波?命运的齿轮开式转动,少男少女们将在这个剑与魔法的世界中书写属于自己的精彩物语。
  • 撼天战歌

    撼天战歌

    战神出则天下战乱起,仙路封则成仙渺茫!浴火重生能否从回仙古纪元的辉煌,血脉力量的觉醒究竟能否破除九天禁忌?仙路封,成仙难,既如此,那就让我来把那仙路轰开,我要让九州,从此凌驾于仙陵之上若如连天神都战不过,何来撼天一说!!
  • 冷血姐妹

    冷血姐妹

    两位冷血校花遇上阳光少年……他们之间会发生什么呢?
  • 上流下流

    上流下流

    小说中涉及形形色色的人物,有小报记者、地产富豪、上海名媛、凤凰男、售楼小姐、警察、私家侦探、高官、名医、艺术界人士、嫖客、三陪小姐、打手、保安……本书是当下人欲横流社会浮世绘,所谓“上流社会下流情欲”都是噱头,书中真正想表达的是:人心比当下楼市更险恶!一个凤凰男欲将上海滩的地产富豪和高官玩弄于鼓掌之间,一个是男人都会喜欢的售楼小姐梦寐以求坐拥豪宅、踏入上流社会,这部以当前楼市为背景的套中套黑幕小说,横跨主要时间段2008年——2011年,上海地产富豪罗人恒的女婿在罗人恒与高官C行贿交易的当晚离奇死亡,导致交易告吹,罗人恒蒙受巨额损失,怀疑是上海市委高官C在幕后操纵,讹诈他的钱财,遂委托原来做过刑警的私家侦探崔攻秘密调查……尊敬的书友,本书选载最精华部分供您阅读。留足悬念,同样精彩!
  • 穿越之基因武祖

    穿越之基因武祖

    末法时代,天地灵气溃烂腐坏,天才基因学者,开发基因芯片,基因药剂,研究出跨时代的生物基因能,却阴差阳错,被一道横跨天际的极光带入神雕世界之中,又将面临怎样的传奇?
  • 倾殇天下

    倾殇天下

    致谢:墨星小说封面网百度“墨星封面”第一个就是,你也可以拿到免费封面!天地谁战群雄,吾欲倾动天下。风云为我突变,雷霆为我起舞。生死刹那别离,万千风采离殇。殇墨神域,我为主!
  • 独宠九尾

    独宠九尾

    经过五百年的修炼,她终于能到听闻已久的人界看看
  • 溺宠萌妃:废柴大小姐

    溺宠萌妃:废柴大小姐

    她,特种兵7部天才军医,人见人怕,鬼见鬼嫌的女汉子,却因为研究室一个小小爆炸,穿越成了异世大陆有爹不如没爹的可怜嫡女。从此,医毒双绝,神兽追随,名震整个大陆!天赋废柴?穴道解开的那一刻,就注定要亮瞎一群狗眼!被弃退婚?她叶晓玥前世今生,都只有她抛弃别人的份!但是那个什么皇子,你不要刚一见面就这么深情款款的看着我好么!相貌妖孽身份尊贵天赋超绝演技居然还这么逼真,这实在是不科学!
  • 天命定缘

    天命定缘

    我无缘,由天起;我逆命,由天起;天定我缘,我逆天;天定我命,我逆天。不论前世,不想后世,在这一世,我命由我,不由天
  • 转身说,爱你

    转身说,爱你

    他对她是否真的动过心呢?找个借口甩开她,去和前女友私会···“假若你能看到我血淋淋的心,你就知道你有多残忍了·······”“·········”