登陆注册
8362000000008

第8章 档案信息检索工作现状

档案信息检索作为档案管理工作一项重要的组成部分,一直以来都受到档案学理论研究者以及档案管理实际工作部门的高度重视。1987年我国档案法提出了有关档案开放利用规定,进一步使档案信息检索工作日益受到关注。当前,档案信息检索工作现状主要体现在以下几个方面。

一、出版了一批档案检索专业著作

20世纪80年代以来,随着档案信息开放工作的不断加强,一大批档案检索研究论著陆续问世,这些论著不仅分析了档案信息检索的重要性和必要性,而且从实际需要出发,深入档案信息检索的原理、步骤、手段和方法,对档案信息检索理论的提高和积累起到了非常重要的作用。这些论著按照时间先后主要有:1985年邓绍兴编著的《档案检索》,1992年汤道銮主编的《档案检索自动化基础》,1992年邓绍兴编著的《档案分类的演变与发展》,1993年张琪玉编写的《档案检索》,1998年邓绍兴主编的《档案分类》,1998年洪漪编著的《档案信息组织与检索》,1999年冯惠玲主编的《档案文献检索》,1999年邹步英等编著的《中国档案分类法使用手册》,2000年张正强主编的《现代计算机档案著录标准化精要》,2001年王向明主编《档案文献检索》。这些论著有的作为高等院校档案专业开设的档案检索课程的专用教材,有的作为档案管理部门检索工作的参考资料被广泛使用,使档案检索的理论和实际联系得更加紧密。

二、重视档案分类检索理论的研究

档案分类是档案实体管理和档案信息组织的关键环节。档案实体管理中的档案分类是指将档案实体按照其来源或所属的全宗进行归类,固定其保存位置,便于人们按照实体的来源检索档案。档案信息组织中的档案分类是打破了档案实体的限制,以揭示档案实体中不同类别档案信息为目的的分类方式,按照这种方式归纳的相同类别的档案信息可以不在一份文件中,也可以不在一个案卷中,甚至可以不在一个全宗中,这种分类方式大大扩展了档案信息的检索途径。档案分类作为档案信息检索的重要手段之一,对档案分类方法的深入研究是非常必要的。随着计算机检索技术在档案信息检索中的运用,对档案分类方法的研究越来越受到大家的重视。其中,有学者对我国档案分类发展的特点进行了全面的归纳和总结:(1)档案分类法的应用与研究在我国的档案分类发展中始终处于主导地位。从20世纪20—40年代的仿杜威十进分类法、纲目分类法类户中档法,50—60年代的组织机构中档法、年代(年度)中档法、问题中档法,80—90年代的《中国档案分类法》(试行本)(以下简称《分类法》)的出版,到《中国档案分类法》(第二版)的正式发行,档案分类法始终是我国档案分类应用与研究的重点,也是档案分类学的主体;(2)由单纯的档案实体分类发展到档案实体分类与档案信息分类并举,两种分类同时发展,互为补充,是中国档案分类法发展的重要特征;(3)由研究档案分类的个别史实发展到全面研究档案分类的历史;(4)从只注重探讨档案分类工作的原则与方法到开始注意探讨档案分类工作的标准化、规范化;(5)从单纯研究档案分类到重视研究档案分类主题一体化;(6)从只注意研究档案分类法、分类工作到开始注意研究档案分类学。有学者提出了档案分类基础理论的结构体系应由五个部分组成:(1)档案分类的历史研究;(2)档案科学组织的研究;(3)档案分类机理的研究;(4)档案信息分类体系的构建;(5)外国档案分类理论研究。

三、重视档案信息检索语言的进一步科学化和规范化

档案检索语言按照构成原理可以分为三种类型:分类语言、主题语言和代码语言。20世纪80年代以来,《中国档案分类法》和《中国档案主题词表》这两部大型档案检索语言工具的相继制定和实施,为档案检索语言的科学化和规范化提供了直接的技术指导,近10年来,计算机技术的发展和情报语言研究的发展,推动了档案检索语言的进一步发展,表现出分类主题一体化、标准化、兼容化、计算机化和自然语言化的发展趋势。

分类主题一体化,指的是分类法与主题法的有机结合,即对分类法和主题法的标识、参照、结构体例等实施统一控制,使之成为一个有机整体,以便同时满足分类标引和主题标引的需要。目前,我国档案分类主题一体化工作主要是在现有分类表、主题词表的基础上,将分类号和主题词进行对应转换,编制对照索引。其优点是不需改动原表,对现有检索系统不会造成多大影响。不足是这种对照索引的结构、功能及词汇水平均受旧表制约,不便采用新的理论和技术,质量难以保证。

档案检索语言标准化,指的是除了编制全国通用的分类表、主题词表外,还通过制定分类表、主题词表的编制规范来实施。目前,《中国档案分类法》和《中国档案主题词表》实际上就是作为档案分类和主题检索标准而编制的,它们作为全国统一的档案分类标引和主题标引规范,与已颁布实施的《档案著录规则》、《档案分类标引规则》、《档案主题词标引规则》和《中国档案分类法专业表编制规范》相配套,为建立全国统一的档案检索体系创造了条件,为档案检索网络化打下了基础。

兼容化,指的是分类表、主题词表的词汇及其结构体系可以直接适用于或通过转换适用于多个档案检索系统。目前档案检索语言的兼容方式有以下几种:(1)词汇自动转换,即通过一套转换规则实现检索语言标识的自动转换;(2)中介词典,是一种协调词表,不能用作标引,只能作为词汇转换的中介,对一批相关分类表、主题词表进行兼容互换;(3)集成词表,即将某些特定领域的分类表和主题词表汇编成一种集成式词表,不仅用于词汇的转换,必要时还可用作标引,并作为新编分类表、主题词表的源词表;(4)词库,将多部分类表、主题词表的数据汇集起来输入计算机,由计算机进行统一的词汇控制和管理,可作为新编分类表和主题词表的数据来源,也可作为现有检索语言兼容互换的工具;(5)综合性语言与专业性语言的兼容,即将一部质量较高的通用的综合性分类表或主题词表作为规范,在此基础上编制各专业性分类表、主题词表,专业性分类表、主题词表的结构、词汇符号等都与通用表兼容。这是目前我国档案检索语言的主要兼容方式。

计算机化主要表现在分类表和主题词表的机编化和机读化。计算机可以在以下几方面辅助分类表和主题词:(1)辅助排序;(2)自动生成分类表或主题词表的各个部分,如分类表、字顺表、轮排索引、双语种对照表、词族索引等;(3)根据需要随时输出机读版或印刷版分类表、主题词表;(4)自动进行词频统计,根据统计结果和标引需要随时进行词汇的增删改,及时进行分类表、主题词表的更新、修订和管理工作。

自然语言化,就是在档案检索中使用文献作者原来所用的语言,这是计算机技术和检索技术发展到一定阶段的产物,它可以取消复杂费时的标引工作,或可以降低标引工作的难度,提高检索效率,使未经过专门训练的用户可以用自己熟悉的语言直接查询各种数据库,这一点在联机网络检索中非常重要。自然语言可以通过以下几种方式实现:(1)关键词法。这是自然语言应用于文献检索最普遍的一种方法,可用于编制书本式关键词索引,也可用于联机检索。(2)文本检索。即用自然语言表达检索课题,借助各种检索方法,直接在篇名、文摘、正文中进行查询。(3)自由标引。即不依据分类表或主题词表,而是从档案题名、文摘、正文中选择合适的词或用自拟的词进行标引。这种标引方式可以达到较高的专指度,提高标引速度。(4)自动分类。由计算机自动分析档案信息内容,判别档案主题并将其归入合适的类,从而使相关文献集中在一起。(5)自动标引。即由计算机根据文献标题和文摘中的自然语言,自动选定文献标引词的标引技术。20世纪80年代至今,我国的科研人员从中国的技术条件出发,根据汉语词汇特点进行分析与研究,提出了各种各样的自动标引方案,比较实用的方法有词典切分标引法、切分标记法、统计标引法、单汉字标引法等。但要建立适用的档案自动标引系统还需要进一步研究。

四、重视档案著录与标引技术的研究

档案著录是按照一定的方法规则,对档案内容特征和形式特征进行分析、选择和记录的过程。档案标引是对文件或案卷的内容进行主题分析,根据检索语言进行检索标识的过程。档案著录和标引是编制档案检索,建立档案检索系统的基础和前提。国际上对档案机读目录交换格式的研究是从20世纪70年代发展起来的,20世纪80年代初,美国制定出《档案机读目录交换格式》标准(MARCAMC),到1996年形成了最新的ISO1709信息交换格式国际标准,它主要是针对目录记录,提供馆藏级概略的档案目录信息。我国档案目录数据著录至今未采用标准的机读目录交换格式,档案数据结构采用的是固定格式,而且各档案数据库数据著录项目的字段名与字段类型及著录项目的总数等也都各不相同,档案数据的共享、交换和传输因此受到限制,对我国档案目录信息的规模化、网络化利用造成了障碍。因此,建立并推行数字网络环境下中国档案机读目录标准,研究网络环境下的档案置标著录方式,成为近年来档案界关注的热点问题。当前对著录和标引的研究主要集中在以下几个方面:

(1)对中国档案机读目录标准的研究。我国档案学研究者借鉴国际档案界和图书馆界在机读目录数据库著录标准化领域通行的做法和经验,对我国档案著录标准化格式进行了系统设计,这些设计具有以下的特点:第一,编码的科学性和标准化。档案机读目录格式是适用于档案的目录格式,必须针对档案的特点设置代码和能反映档案特点的数据字段。第二,与档案著录规则相兼容,即与国家行业标准《DA/T18—1999档案著录规则》和《国际标准———档案著录规则(总则)》兼容,建立适合档案整理体系的多级著录。第三,中国档案机读目录格式记录的计算机生成与美国等国家的档案机读目录格式的结构和信息编码都是兼容的。第四,档案著录完整性上还有局限性。由于我国现有的档案著录规则主要还是针对纸质档案的文字著录,档案机读目录格式标准的功能受到了限制。我国目前的计算机检索仍停留在手工著录阶段或较低水平,因此,档案界应密切关注档案机读目录格式的制定和实施,档案置标著录及其与MARC格式进行数据交换的问题。中国档案机读目录标准格式的发展前景是通过手工著录,到机读目录格式,再到档案置标著录的不同发展阶段,利用档案机读目录格式(MARCAMC)与档案置标著录(EAD),形成网络利用档案信息资源的系统梯度检索体系。

(2)对档案置标著录的研究受到关注。档案置标著录(EAD)(ENCODED ARCHIVALDEION)格式主要用于描述档案和手稿资料,包括文本文档、电子文档、可视资料和录音资料。EAD与MARCAMC的主要区别在于,MARC AMC主要针对目录记录,它侧重提供馆藏级概略的档案目录信息,而EAD则主要针对检索工具的构建,侧重提供文件级详细的著录信息,它最突出的优势是能够反映档案检索工具的层级性,便于按照“全宗—类别—案卷—文件”的线索进行检索,适用于档案信息的网络发布和检索。从20世纪90年代后期开始,我国档案界开始有人介绍EAD并对其功能进行评价,但由于我国档案著录标准化的滞后,档案部门鲜有利用EAD进行著录的。

此外,对档案自动标引、自动分类等问题,档案学界也进行了进一步研究。对计算机主题标引的研究主要集中在三个方面:如何从文本中切分出关键词、如何从关键词中分辨或引导出主题词、如何确定已选出的主题词是否为标引词。对档案自动分类有学者也进行了具有实际意义的研究,如许建潮、胡明介绍了一种档案文献的计算机分类标引算法,该算法以主题词作为分类的依据,对不能直接映射归类的档案,统计文献主题词隶属于各个类的隶属度,利用模糊关系对档案进行分类标引。

五、对档案检索工具、检索方法和技术的研究更加深入

对检索工具的研究是检索工作顺利开展的基础和条件,当前对检索工具的研究主要集中在以下几方面:(1)进一步增强传统档案检索工具的功能,建立和完善各种类型的检索工具,实现各检索工具在揭示档案信息内容方面的互通和互补,例如,在建立馆藏性检索工具如卷内文件目录、全宗目录、案卷目录、案卷文件目录的同时,进一步完善查检性检索工具如分类目录、主题目录、专题目录、人名索引、地名索引、文号索引等,形成实体检索与内容检索的立体检索结构。(2)提高计算机技术用于档案信息检索的效率,相关研究主要集中在计算机检索系统的结构和功能研究,机读目录数据库的建立研究,计算机检索分类研究和计算机检索系统的设计与开发等问题研究。(3)开展数字网络环境下档案检索方法、技术和标准的研究。相关问题的研究除了对计算机检索的一般步骤和档案检索策略进行研究外,着重关注了在互联网环境下档案检索的有关问题,如档案网络检索标准的构成要素及相互之间的关系,标准的作用以及标准的建设等。

同类推荐
  • 从哈佛学院到耶鲁礼堂:在哈佛和耶鲁听讲座

    从哈佛学院到耶鲁礼堂:在哈佛和耶鲁听讲座

    《从哈佛学院到耶鲁礼堂:在哈佛和耶鲁听讲座(汉英对照)》内容简介:哈佛和耶鲁是莘莘学子心中神圣的殿堂,这不仅在于它们课堂上传授的知识,更在于它们沉淀下来的那些引人深思的智慧。如今,就让我们走进这两卒思想的殿堂,聆听智慧流淌的声音!无论你是在校的莘莘学子,还是社会上的“打拼”一族,抑或是经历丰富的成功人士,阅读《从哈佛学院到耶鲁礼堂:在哈佛和耶鲁听讲座(汉英对照)》,将会提升你的品位,启迪你的心智,陶冶你的性情。
  • 边界的瓦解与重构

    边界的瓦解与重构

    《边界的瓦解与重构》绝不是一本简单的关于网络的书,它借用网络的思维方式评判着一个宏观与微观相结合的意识形态。很少人有勇气或者不屑来写这样的一《边界的瓦解与重构:网络语境下的经济全球化与文化本土化》。因为这是对一个冷冰冰的网络及其相互关联的经济与文化进行线性描述的同时,还要用大量的非线性知识结构来进行佐证的论著。不得不承认,这不是一本字字珠玑的书,但是,埋藏在书本深处的一些绝对属于作者自己的真知灼见,和那些压抑不住的理论激情,或许会给那些研究网络的学者们一些启发。
  • 反校园暴力101招

    反校园暴力101招

    本书作者以多年从教的经验,详尽分析校园暴力的定义、性质、起因和行为特点,分别针对受害者、施暴者、家庭和学校,提出了在不同情况下的应对措施。
  • 中国党政公文解疑全书

    中国党政公文解疑全书

    《中国党政公文解疑全书》共四篇,第一篇公文文种解疑;第二篇公文格式与行文解疑;第三篇公文写作技巧解疑;第四篇公文处理规范解疑。所列题目,均是长期研究和讲学实践中积累的,是与公文工作者及教学人员广泛接触和交流中的经验总结。 这些题目反映的问题源自公文处理工作的第一线,具有很强的代表性、实用性。读者通过阅读本书,能全面地掌握公文写作中的规范与技巧,了解公文处理实践中的热点、 焦点和难点。
  • 浙籍作家翻译艺术研究

    浙籍作家翻译艺术研究

    本书所关注的主要是出生在浙江、也主要在浙江以及周边江南地区从事翻译活动的文学翻译家及其翻译艺术成就。作者力图将翻译理论思想的阐述与具体翻译实践的探讨结合起来,并将宏观的研究综述与微观的翻译文本分析结合起来,力图遵循相关翻译理论以及比较文学理论中的跨文化研究的方法,对浙江文学翻译的成果作了客观的梳理和研究,对浙籍作家的杰出的翻译艺术以及相应的译学思想进行了深入的探讨。
热门推荐
  • 萧潇江湖

    萧潇江湖

    穆家庄一夜之间被灭门,竟是因为一把传说之中的神剑?!一脸寒霜一身红衣的穆小小立于穆家庄废墟之上,狠狠地将手里拿着的剑扔到地上,看似普普通通的剑落到地上,却把地面砸了个大窟窿!“就是这把破剑害得我家破人亡!不过一把剑而已,凭什么?!你们不是想要它吗?来拿啊!”辰堇按住穆小小的肩膀,薄唇紧抿,“别闹!”
  • 千缘,厮守

    千缘,厮守

    我是千缘山上一只狐妖,偶遇天狼一族族长风锦乐,从此生活不再平静。我是妖王妃?懵!风锦乐原名东方墨,是妖族妖王?更懵!————————一小段对话————————“逸儿,如果有一天,为夫不是风锦乐了,逸儿还会要为夫吗?”“不要。”“必须要。”“为什么?”“没有你为夫睡不着。”“不正经。”
  • 嫁汉嫁汉

    嫁汉嫁汉

    紫逸慢慢地睁开了眼睛,脑海里闪过一丝回忆,却始终不抓住,脑海里却听到叮的一声响,“3。。。2。。。1。。。绑定成功。。。”紫逸问,:“你是谁。。。”“愚蠢的宿主,我是系统大人,简称系统君。“紫逸抚着头,好痛,一丝丝画面浮现在脑海里,似乎是她的记忆,又似乎不是,感觉这记忆对我很重要。这是系统君带着一丝诱惑的说:“你想要回记忆吗。。。”紫逸丝毫没有犹豫的说:“想。”因为好像记忆对她很重要,而且心里的某一处地方强烈的催促着我,要报仇,要报仇,要报仇,杀了她,杀了她。。。。。。
  • 爱的火花

    爱的火花

    一个平凡女孩,从乡下来到城市,遇到一个冷酷高傲的富二代。“你真的跟她长得很像,但是她不辞而别,抛弃了我!”他如此霸气地说道。“可你不能把气往我身上撒啊!”她内心不满。“谁叫和她长得如此相似!”他很是高傲。
  • 白色眷恋

    白色眷恋

    因为不满皇马6比2的比分,中国青年律师沈星怒砸啤酒瓶,结果电光火石间,他穿越成了佛罗伦蒂诺的儿子,且看来自09年的小伙子如何玩转03年的欧洲足坛
  • 有个人爱了你很久

    有个人爱了你很久

    “你爱我吗?”“爱。”“那我们能在一起吗?”“对不起。”“为什么?”“抱歉。”“我不想听对不起。”“……”“有些风景,只能喜欢不能收藏,就像有些人,只能适合遇见不适合久伴。”——宁潇潇“潇潇,感情不是一个人的独白,如果他一直不入戏,你有何必为他苦唱情歌?”——郑若妍(每天更新,放心入坑(●°u°●)?」)
  • 唐宗战门

    唐宗战门

    江湖虽流传唐门之传说,但多为野史。时至如今已无人知唐门之真容,唐门之所在,唐门之所为。而当世人还在神州之土欲解唐门之谜时,在那遥远的宇宙那方,唐门的传奇还在续写之中!武道一途元(人元。地元、天元)、灵(化灵、虚灵、通灵)、玄(阴玄、阳玄、太玄)、劫(魂劫、魄劫、命劫)、仙(元仙、灵仙、玄仙)五大境界!门派品级:赤元、青灵白玄、蓝王、墨皇、紫宗八脉武学如何威震宇宙!四方征战如何雄霸一方!尽在唐宗战门!
  • 远古战帝

    远古战帝

    他-金甲金枪征战远古天下;他-脚跨赤火神驹玩转修行世界;重情铁血、坚毅勇猛。为亲,他可屠戮仙魔;为友,他可舍己忘死;为爱,他可与天下为敌!
  • 为爱成魔:气煞夫君不偿命

    为爱成魔:气煞夫君不偿命

    “千尘”“嗯?”“你的家乡在哪儿?”“地球”“原来球里也能住人”“......”“千尘”“嗯!”“飞机是什么鸡”“会飞的鸡!”“莫非这世上还有不会飞的鸡?”“呃”“千尘,汽车是什么车?”“马车的弟弟!”“马车也有弟弟?那马的弟弟可是叫汽?”“千尘”“滚!!!”“......”
  • 相思谋:妃常难娶

    相思谋:妃常难娶

    某日某王府张灯结彩,婚礼进行时,突然不知从哪冒出来一个小孩,对着新郎道:“爹爹,今天您的大婚之喜,娘亲让我来还一样东西。”说完提着手中的玉佩在新郎面前晃悠。此话一出,一府宾客哗然,然当大家看清这小孩与新郎如一个模子刻出来的面容时,顿时石化。此时某屋顶,一个绝色女子不耐烦的声音响起:“儿子,事情办完了我们走,别在那磨矶,耽误时间。”新郎一看屋顶上的女子,当下怒火攻心,扔下新娘就往女子所在的方向扑去,吼道:“女人,你给本王站住。”一场爱与被爱的追逐正式开始、、、、、、、