10.4.1.1媒体自动分析与处理工具
从上个世纪90年代中期开始,视听内容的自动处理就已经取得了很大的进展。同时也出现了处理视频的工具,可以对视频的转换和编辑效果进行检测,可以抽出关键帧和元数据,并且允许对视频对象进行分类。这些过程在很大程度上是基于低层次的录像和图像描述符的分析,例如色彩记录形状与结构的识别以及运动矢量等,可以相对可靠地从这些低层次的描述符中获取信息。国际标准化组织已经认识到了这一点,并且在MPEG-7的视频与音频部分中找到了自己的方法。然而,因为绝大多数工具都没有媒体语义的概念,这就存在着对它们可获取的信息种类的限制。因此,它们产生的结果通常是不精确的或不符合用户期望的。例如,如果用户使用图像相似识别来寻找某个对象或是人物,他们期望的图像是显示不同场合下的这个对象或是人物,但他们得到的只是一些数字统计值在某一给定范围内的图像。因此,可能存在一整组图像都与用户的初始查询不相关。这当然会使用户的期望落空,使用户认为这种工具是不可用的。
自动索引并不总是产生100%准确的结果。例如网球比赛可以被相对简单地进行分类。然而,一个自动索引工具可能把网球广告分类成网球产品展示。类似的,使用新闻格式的喜剧,却被当成了新闻类节目。
基于音频和语音分析的元数据自动检索,通常也只有95%的准确率,甚至更少。因为这种检索试图把所发现的每个片段与已知表述相匹配,这种匹配可能是不准确的,尤其是当文本中使用特殊措辞或专业术语时,那么命中率可能会变得很低。
因此,目前所使用的自动媒体分析与处理工具,还不能没有人工的参与。必须以正确的方法应用它们才能实现用户的期望。对于图像或音频相似搜索来说,通过附加更多的文本信息来建立一个上下文环境可能是有用的。为确保结果的正确性,自动索引编写与自动元数据检索一定要由专家来校订。然而,这些工具可以在内容管理系统中产生积极的作用,它们的功能如果能在一个集成系统中得到正确的应用,那么它们可以为内容管理系统提供增值效应。
10.4.1.2把内容管理系统作为通用的、开放的平台
许多人把内容管理系统视为一个“黏合”不同系统的工具,其中包括媒体生产、传播和归档保存等系统。因此它一定要能够容易地集成所有种类的硬件和软件解决方案、遗留系统以及来自于不同厂商的不同产品。此外,它也应该可以透明地处理所有不同的媒体类型,同时仍然为自动处理或特殊应用程序提供高级支持,但由于产品与设备以及遗留系统的接口常常没有很好定义或是不能打开而进行集成,对它们的集成会要求非常特殊的支持,所以这种要求通常会实现不了。因此,一个内容管理系统(无论它是多么具有灵活性或是开放性)可能不能集成所有的相关系统来充当一个平台的作用,这是因为缺少相关系统的支持。在绝大多数情况下,内容管理系统也只能提供某些特殊集成设备所拥有的功能而已。例如一个视频浏览编码器如果不能支持时间编码的话,内容管理系统也就不能在视频浏览中提供时码标记。另外,每一个新系统组件的集成都可能会需要非常特殊的适配。然而,通过加深理解系统特性以及用户与工作流的需求,就可以达到较高的抽象层次。这就是允许提供集成关联与可被支持的普遍特性集合。在本书中所描述的系统框架已经在这个方向走出了第一步。
尽管在系统中内容对象被当作数字化数据(也就是比特和字节)来处理,但如果没有先进的处理过程支持,那么要对未知格式的媒体进行透明的处理是不可能的。例如为了传送内容,除了选好合适的传送方法外,内容管理系统还必须要能够处理媒体类型。连续型媒体能否以一定速率传输就是取决于它们的格式。专有格式需要使用专有的工具,因为它们的内部结构是不公开的。内容的表示也要依赖于接收设施的能力。一个高端设施也许可以接收全分辨率、全带宽的视频资料,然而一个移动客户端只能够接收一个非常低码率的浏览版本。对结构化的内容格式(例如网页),要自动选择相关内容部分会变得更加困难。图像在低功能移动设备上的显示可能是有问题的。然而,这些图像可能包含非常有价值的信息,这时即使传输一个低码率的版本也要比仅有附带文字说明强得多。因此,内容管理系统要能为处理数字化数据提供非常基本的支持,也要能提供较为复杂的操作,这些操作要求我们具有内容结构、句法,甚至还有语义学方面的知识。
不同的描述方案和元数据模型通常也会妨碍对内容管理系统的引入。在同一组织内(有时甚至是在同一部门内),可能发现多个互不相容的信息系统和数据库。只要公共的、基础的元数据之间没有达成共识,内容管理系统是不可能解决这种状况的。内容管理系统可以有助于提高不同系统的可访问性,并且可以把它们集成到应用程序内。然而,如何定义合适的元数据集合的问题仍然存在,这只有通过标准化组织和感兴趣的团体来解决,或者至少要内容管理系统项目中的一个机构来完成。
建立一个规模可调的系统,既能满足小型的、部门级的需求,又能满足大型资料库的需求,这是一件非常具有挑战性的工作。前者是基于普通的IT结构组成,后者要包括以下系统的集成,即复杂的存储结构、大型数据库、ERP接口、自动化系统、非线性编辑以及新闻工作室系统等。对上述两种规模的系统,如果使用同样的结构框架,那么对小型系统来说,就是过度了。在这种环境下,对于系统来说,采用同样的应用软件和系统接口会更好一些,而不是采用经过简化的、调整过的后端组件。为了建立系统间的协同操作,一定要慎重选择针对不同系统的技术,既能实现系统的内部协同,还能满足各自的特殊要求。
10.4.1.3对工作流的思考
内容管理系统的主要目的就是在内容的创作、生产、查询和消费过程中给用户以支持。不同的富内容机构、专业团体和个人用户都对系统和与系统间不同组件的交互有着不同的要求。此外,内容管理系统在反映变化的同时,也应该记录和反映已建成的工作流。
开始,系统开发者和用户两个方面对系统的要求和功能缺乏理解。接着,过高的期望没能在操作中实现,使系统的开发者和用户都感到很失望。对于用户来说,内容管理系统显得太过僵化而不够灵活,而对于系统设计者来说,用户的要求又显得不够合理。人们逐渐认识到了解决这个问题的方法,那就是基于组件的方法,这种方法允许建立更加灵活的系统。工作流引擎也为一系列预先定义的工作流提供了支持。此外在实施内容管理系统的过程中,在项目初期就让用户一起参与,这有助于在项目刚开始就能捕获用户的需求,并向他们解释技术的潜力与限制。达成一个对系统什么可为、什么不可为的共识是非常重要的,能让用户了解他们所关注的问题,这将推动媒体专业的工作以及支持其发布。同时要让用户明白,自动过程是不能取代一切的。
10.4.2未来发展
如今内容管理系统已经可以在内容生产、管理、传送以及销售等方面进行实际使用。然而,还存在着进一步发展和提高组成内容管理系统的子系统与组件的空间,尤其是在以下几个方面:
·更好地支持自动内容处理过程。
·更好地支持复制海量内容及与内容相关的元数据。
·满足不同系统类型和请求的更加灵活的基础设施。
·更好地支持IPR管理和保护。
前三点涉及的是内容管理系统的提高与进一步发展,但我们并不期望它们直接就可以提高现有的技术。我们需要新的概念来克服目前所用方法的缺点。后者指的是版权以及版权保护日益增长的重要性。尽管存在着大量的版权管理和保护技术(例如水印技术),但是到目前为止,它们在专业内容管理中还没有一个很高的优先权,即使出现了新的发行渠道以及在公共领域内更多数字化的内容格式。因此,版权管理问题将成为内容管理系统所关注的一个主要课题。内容管理系统最终将成为一个真正的数字资产管理系统。
可以预期,系统设计人员与使用者之间对于不同功能和需求的理解将会更加深入。厂商和用户都已经从经验得知,新技术是利大于弊的,但是新技术也不是万能的。