第一节 语言文字之概述
锲而舍之,朽木不折;锲而不舍,金石可镂。
——荀子·《劝学篇》
语言和文字是人类交流的媒介,在一定的人群中传播流行,都是属于社会的;由于传播的方式不同,所以流行的范围也不同。语言以空气中的声波为载体,直接的传播距离不过几百米,由于人群的流动性,间接传播的范围得以扩大。古代社会能量消耗低,活动范围局限在一定地域,形成了地域文明。语言局限在更小的地域,就形成方言和俚语。相比之下,文字以视觉为载体(或以触觉为载体,如盲文),可以流传得稍广些,甚至可以传到更广的地域,但文字需要学习和记忆方能解读,能够流传的人群就限制在有解读能力的这部分人中。也正是这个原因,文字比语言更容易约束和控制。当初,秦始皇下令“书同文”、“车同轨”,却没有要求“语同声”,因为做不到,当时也没有必要。这个“书同文”有很强的限制,从此华夏文明成了一个统一体,即使有再大的内部纠纷,也不会分裂成不同的区域文明了,我们的文字因之可称为“中华文明之瑰宝”。
1952年,在陕西半坡村发现一处氏族村落遗址,估计距现在有六七千年。在半坡村出土的陶钵口沿上刻有二三十种符号,这可能是汉字的起源。19世纪末,在河南安阳发现了刻有文字的龟甲和兽骨,称为殷墟甲骨。甲骨文是今天汉字的基础。
中国孔子基金会理事、中国韵文学会顾问苏渊雷先生曾说:“中华民族文字创制,远古难稽,今有实物可证者,以甲骨文为最早。自秦并六国,统一文书,八体定型,规模初具。先秦小学立基,首授六书九数;汉廷课吏,例试识字多寡……自东汉许慎《说文解字》出,始一终亥,部次厘然。而中华民族文字信息之储存,与夫意识形态之客观体现,至是大备。”
东汉安帝建光元年(公元121年),我国第一部探究字源的书《说文解字》由许慎编纂完成。今存宋初徐铉校订本,每卷分上、下,收字9353,重文1163,按文字形体及偏旁构造列540部,首创部首检字法。
晋吕忱撰《字林》,部首依《说文解字》分540部,为补《说文解字》漏修而作,收字12824。
宋仁宗宝元二年(公元1039年),王洙、司马光等奉诏撰修《类篇》,分544部,收字31000余,重文2100余。
明梅膺祚撰《字汇》一书,十四卷,将《说文解字》部首化为214部,依据楷体对部首和各部中字,按笔画多少顺序排列,共收字33179。
康熙五十五年(公元1716年)印行、张玉书等奉诏编纂的《康熙字典》,共收字47043,剔除重见字,实为46933字,部首的建立基于楷书字形,共214个。
1915年出版的《中华大字典》,收字48000余,按部首编排,分条解释字义,条例说明篇名,较《康熙字典》详细。
中华人民共和国成立后,1956年至1964年间推行了第一批简化字。在此基础上出版的《新华字典》,取部首为189个。
从世界潮流来看,某种语言、文字的地位,是和国家、民族的政治经济地位分不开的。尽管中文是联合国六种工作语言之一(其余五种是英文、法文、俄文、西班牙文、阿拉伯文),讲汉语、写中文的人口数量最多,但是它正在面对越来越强大的威胁,即英文的威胁。中文是否有优越性?是否站得住脚?不能不引起人们的关注。
几千年来,方块汉字为弘扬中华文化作出了贡献。尽管在我国的不同地区语言多样,但统一的文字沟通了思想,凝聚了各民族,保存、发展了文化。李白、杜甫、曹雪芹、鲁迅、茅盾、老舍、巴金……这些文学大师都是使用这种表现力强、精炼的文字而创作的!
中文常用字表现出高度的集中性。国家标准规定的3755个常用字,占一般文章常用字的99.9%。可见,汉字虽难学,但若方法正确则可反难为易。汉字的词组合理、易记,如内科、外科等,这些医疗上的词在英文中都是新词。故英文中单词已达5×100000个,学英文的大部分精力要放在记忆新单词上。从长远看中文比英文优越。在英文中,从1到12均为新词。777这个数字,英文要用十个音节读出,中文只有五个音节(读作“七百七十七”)。
更为重要的是,中国字有固定的笔顺。可以将“丶—丨丿\”当作汉字的基本几何单元,对应“1、2、3、4、5”,则“王”字的码是2232,“口”字的码是3232,如此等等。故汉字可进入电脑,且发展无限,可容纳任意数目的汉字。以中文的五个单元对比英文的二十六个单元,显然汉字在信息处理方面比拉丁文字字母更优越!
1981年在北京召开的汉字信息处理研讨会认为,作为象形文字的中文,信息密度比英文高30%,电脑处理时比英文快150%。汉字并不落后,落后的是科技!随着中文文字处理机、中英文电子打印机等设备的制成,后一问题正逐渐得到解决。
作为世界著名的物理学家、数学家、教育家,王竹溪为大家所熟知,但作为功底深厚的文字学家,就鲜为人知了。1988年,由上海翻译出版公司和电子工业出版社联合出版的王竹溪所编纂的《新部首大字典》,让大家领略了作为自然科学家的王竹溪百科全书式的学者风采。
第二节 发明汉字检索机器化新方案
早在荆南中学毕业后在家养病期间,王竹溪就学习了《康熙字典》,对汉字检索发生了浓厚的兴趣。那时他才15岁,所受的教育基本上还是传统文化。进麦伦中学以后,王竹溪开始接受西方文化的熏陶,后来又学了音韵学和法、德、意等外语,他就有了进行比较研究的基础。
在五四新文化运动中,除了提倡白话文、引进标点符号、发明注音系统外,最激进的一种意见和潮流就是完全废止传统文字,采用以拉丁字母为基础的拼音文字,倡导出版刊物,用拼音文字发表文章和翻译古典文学作品。热闹过一阵子,终究没有达到社会的接纳和认可,未能存活下来。
在历史上,属于华夏文明圈的日本、高丽(今朝鲜、韩国)、越南,原来都使用汉字,他们后来相继采用注音符号,建立了新的以拼音为基础的文字体系。这是因为他们地域不大,基本上是“语同声”,方言不是严重的问题。而中国则不同,华夏文明的文化源远流长,深深植根于民族和社会,具有很强的惯性和凝聚力,轻易不可能动摇。而且,中国虽然“书同文”,但由于方言很多,不同方言对同一个字词的读音存在很大分歧。诗人用的韵谱也只能以“中州音”为准。民国时代开始推广“国语”,1949年后接着推广“普通话”,至今将近一个世纪,看来今后仍然还有很长的路要走。实际上,也只有做到了“语同音”,才有可能采用以拼音为基础的文字体系,所以现在任何文字的改革还只能以现行的文字为基础。
拼音文字检索的基础是字母,因为拼音文字是由字母拼成的,可以根据读音来分解,按照拼写字母的顺序来检索。我们的文字是单音字,而且有四声,即使勉强根据读音来分解,也存在很大的重码问题。可是在另一方面,方块字是由各种笔画单元组成的,可以根据字形结构来分解。于是,王竹溪想到,可以将汉字分解为若干基本组成单元,将这些组成单元像英文字母那样对待,就可以按照组成单元的顺序来检索。他产生这个具体想法,还是1943年在西南联大时的事。
根据字形结构来分解的想法,源自我们传统的做法。我们历史上的第一部字典,东汉时期的《说文解字》,就是根据字形结构,分解出一些共同的部分。这些共同的部分称为部首,共540个,用它们对汉字进行分类,就可以按照部首的顺序来检索查找。许慎的这种做法一直延续和流传下来。《康熙字典》将部首归并为214个。后来流行的字典,部首的数目大致在两百左右。而王竹溪的想法并不停留在简单地用部首来对汉字进行分类,他是要用部首来拼成汉字。例如,酉→西一,固→口十口,然→月犬火,舆→臼车一八等。
所以,确切地说,他分解出来的已经不是原来意义上的部首,而是构成方块汉字的组成单元,我们称之为字元。他尝试用简单的字元来解读复杂的汉字字形,就像用分子、原子来解读各种物质的构成一样。这种想法已经超出了我们的传统思维,具有西方文化注重分析将复杂的成分分解成简单成分的色彩。许慎将汉字按照相似的部分来分类,这是一种整体性的综合思维。而王竹溪将汉字用一些基本的字元来分解则是一种结构性的分析思维,或者说是物理思维。
按照王竹溪的这个想法,二百多个部首就太多了,它们并不全都是汉字最基本的组成成分,而且数目太多不容易记住,用起来就不方便,所以他尝试简化所有的部首,减少部首的数目。然而,这个数目也不能太少,否则,对于笔画多的复杂汉字,就需要十多个部首来拼成,拼凑和分解都不容易,并且难以避免重码,无疑为检索增加了困难。
经过反复尝试,王竹溪最后选定了56个字元,称之为新部首。这个数目虽然比拉丁字母多出一倍多,但仍容易记忆和背诵。这56个部首可以分成八组,每组七个。于是,王竹溪又编出八句歌诀,以便念诵记忆。
一竖点撇弯乙绻,上十乂幂厂人八。
包儿廿阜山小尸,女土口丰止牛踔。
心手犬水木月爪,火日示病目田四。
西虫臼丝衣竹羊,车门言雨金食马。
有了这些构成汉字的基本单元,还要有一套用它们来分解或构成汉字的规则。西方文字是根据读音来分解或组合,用字母来拼音的顺序就自然是字母排列的先后顺序,这是一维空间的线性关系,很容易唯一而没有歧义地确定。与西方的文字不同,王竹溪是用构成字形的字元,这就需要一个如何在平面上读取或排列它们的规则。他选择的规则是“先上后下,先左后右”。由于平面的图形安排是在二维空间的几何关系,所以还需要有一些附加的规则才能避免歧义。
有了这56个部首和用它们来分解或组成汉字的规则,就可以得到每个汉字与构成它的字元之间的对应关系,就像每个英文单词与构成它的字母序列之间的对应关系一样。于是,我们就可根据字元序列的顺序来检索查字,就像根据英文字母顺序来检索查字一样,这就是王竹溪提出的“新部首检字法”。
比英文复杂的是,这里还有一个重码的问题。例如,“人”与“入”、“土”与“士”、“日”与“曰”等。可以说,重码是王竹溪在选择部首和设计规则时所要克服的主要困难。他提出的新部首检字法,基本上满足不能重码这个条件,但仍然有少量重码字。用新部首分解五万多个汉字,只有34对汉字的新部首次序完全相同,需要附加一个符号来分辨。现在大家使用手机和电脑,熟知重码是提高效率的一大障碍,也就能够感受到在五万多个字中仅有三十多对重码字是多么大的成就了。
1943年,还没有电脑,也还没有汉字检索机器化的问题。就是到了1979年,王竹溪在《自然杂志》上发表了论文《汉字检索机器化的一个方案》,汉字输入法也才刚刚提到议事日程。将西方科学的分析方法运用于传统汉字,王竹溪的这一开创性的研究超越时代三十多年。由于把握了先进的思维方法,他走在当代文化发展的最前沿,成为研究汉字检索机器化的先锋。
第三节 编纂《新部首大字典》
只有将所有的字都分解成字元的组合,才知道哪些字是重码。为了避免重码,就要调整字元;而调整以后,又要用新的字元来分解所有的字。这样一次一次地尝试,才能找出最理想的字元。所以,王竹溪最后选定这56个字元,是无数次反复尝试的结果,其中艰辛可想而知。而这无数次的反复尝试,实际上就是在一遍一遍地整理排列所有的字,最后选定字元,同时也就选定了所有汉字的一种排序,于是就有了一部新字典的骨架。而要将这副骨架变成内容充实的一部字典,则是一个更加巨大的工程。
和写书一样,要编一部字典,首先要选定读者对象,亦即为字典定位。最简单和最容易的选择,当然是编一部常用字的字典,只突出和强调新部首检字法的特点。这就像发明四角号码检字法以后所出的《四角号码字典》一样,20世纪40年代中期甚至出版了四角号码检索的《现代英汉辞典》。可以说,这是充分发掘了四角号码检字法这项发明的潜能,其中只收入常用字数千个,工作量相对来说就比较小,可以快速出版,既推广了这一发明,又可获得经济的实惠。
然而,这不是王竹溪的目标,他年少时学习了《康熙字典》,并在以后反复查阅,在心中留下了深刻的印象。所以,王竹溪的目标是编一部像《康熙字典》那样水准与层次的字典。这就不是一部给一般人临时忘记了查个字用的普遍字典,而是供更高层次的读者使用的字典。
首先,这样一部字典收字要全,要尽可能囊括古今书籍和报刊上所见的字,从而能帮助读者找到普通字典没有收入的生僻字词。而汉字是在随着时代与社会的发展不断演变的。
有人统计过《易经》、《尚书》、《左传》、《公羊传》、《论语》、《孟子》等十三经中不相同的字,为6500个,因此秦代以前的常用字不过3000左右。在许慎的《说文解字》中,收入了9353个字条,这是东汉时期的情形。到北宋的司马光等的《类篇》,已经收字31000余,而到了清朝1716年成书的《康熙字典》,收字就超过47000之巨。
到了近代,民国初年由徐元浩等主编、1915年出版的《中华大字典》,解释字义比较简明,并校正了《康熙字典》的错误两千多处,收字超过了48000个。
1955年,日本诸桥辙次的《大汉和辞典》收字已近50000个。而1968年张其昀总编,林尹、高明主编的《中文大辞典》,收字也是接近50000个。王竹溪生前编纂定稿、在去世后五年(1988年)出版的《新部首大字典》收字51100多个,包括《康熙字典》及以后增加的字和简化字,超越以上诸字典。可以说,在中文字典的发展史上,王竹溪的《新部首大字典》是收字突破50000个的一座里程碑。
根据数据,可以得知历代字书收入字数与成熟年代的关系。其中,《训纂篇》、《字林》、《字统》和《玉篇》(增字本)的成书年代都有误差:《字统》的误差较大,其余三部的误差较小。从中可以看出,除了梅膺祚的《字汇》以外,其他各书收字数与年代的关系基本上在一条直线上。这是一种有意义的关联,还是偶然的巧合?如果是一种有意义的关联,那么字数增长的平均速率与哪些因素有关?以及为什么明朝的数据偏低?这些都是很有意思和值得研究的问题。这些问题,需要请语言文字和社会历史学家来分析和解答。
搜集在社会生活中新产生的字词,是一件日积月累的工作,要靠长期的积累,没有现存的资料可查,不可能一蹴而就。这就像作家的生活积累、画家的旅行写生和音乐家的民间采风,十年铸一剑,功力全靠岁月来练就。搜集新字词是中文系语言文字学家的一项专业性工作。王竹溪以一位物理学家的业余之身,数十年如一日,一点一滴地收集整理和研究。他往往是在报纸杂志上看到一个新字词,就赶紧写信去了解,或者在会议上当面向人请教。他先后给内蒙古土右旗吴坝公社小厂库伦大队、山西省蒲县寨子生产大队等地发信询问。开人代会时,他遇到大寨大队的贾存锁同志,也向他请教报上登大寨公社消息时出现的当时字典中未收入的字。对于电话号码簿上出现的字典中未收入的字,他也向有关的同志发函请教。通过广泛地向群众学习,排除了编纂字典过程中遇到的某些困难。在《新部首大字典》里新增的字词,可以说字字珠玑,都渗透了王竹溪的心血。
搜集和整理各种字词,还只是编纂字典的第一步。接下来,要对每一个字精确地定音和释义。由于我们只是“书同文”,还没有“语同音”,存在各种方言,又经历了上千年的演变,这定音是一件非常复杂和细致的事,需要对每一个字的读音都有完全和正确的了解。例如,用来表示量大小的词中,与英文nano相应的词,现在音译为“纳”,意为毫微,即千兆分之一。“纳”这个字在早期审定为“纤”,有人按照方言读音,说“纤”与“千”同音,易引起混淆。王竹溪马上指出,“纤”这个字的正确读音不是qiān(音同“千”)而是xiān(音同“先”)。又如,王竹溪的一位学生叫仇韵清,当时大家都叫她“小仇(音同‘绸’)”,她也欣然接受。而王竹溪听到后更正说,“仇”这个字做姓氏时不念chóu(音同“绸”)而念qiú(音同“求”)。
在为每个字定音时,除了《新华字典》外,王竹溪还参考了《广雅》、《集韵》、《康熙字典》等许多其他参考资料。对于古字中的一字多音情况,他都是尽可能只采用一个读音,使读音简化。在这里,简化仍是他的追求。
关于王竹溪为名词的准确释义,可以一个物理学名词为例。在量子力学中,波函数的模的平方正比于实验测量的概率。这是玻恩于1926年根据他对散射问题的研究而得出的一个基本假设。他的这个假设即为大家所接受,他也因此获得1954年的诺贝尔物理学奖。这个假设在英文中称为波函数的statistical interpretation。其中,interpretation这个词有“解释”的含义,在物理学名词中单独使用时也审定为“解释”。所以,对于波函数的上述假设,许多人都译为波函数的“统计解释”。但王竹溪指出,在这里不能用“解释”这个词,而应该用“诠释”这个词,译成波函数的“统计诠释”。他说,“解释”与“诠释”这两个词在中文里含义不完全相同,而在英文里可以对应于同一个词,这是中英文化的差异。“解释”是根据某种更基本的物理和机制来对事物进行分析,作出逻辑和因果的说明。在量子力学中,波函数本身就是最基本的东西了,不可能再用某种比它更基本的东西来解释。玻恩的基本假设是一种对波函数的理解和认识,是我们赋予波函数的属性,赋予某种事物以某种理解和性质,这种思维的方式和做法,恰当的称谓是“诠释”。例如,音乐家创作的歌曲,歌手在演唱时可以根据自己的理解进行发挥,媒体将之称为歌手对歌曲的诠释。
除了在字义解释上力求明确外,《新部首大字典》还粗略地记录了汉字的演变。凡是《说文解字》上面有的字,王竹溪在字义解释的最后将《说文解字》的解释收录上,并且将基本的篆字也收录上,凡是甲骨文可考的,也都收录上,只是没有收录金文。
第四节 出版及评价
笔者曾到原公安县政协文史委员会主任张遵明(王竹溪纪念馆高级顾问)家中拜访,当时王竹溪纪念馆尚在筹建当中。张先生将王竹溪教授所编纂的《新部首大字典》及其手稿给笔者浏览,手稿约有几块砖头厚,上面字迹秀丽,很难相信洋洋250万字的著作出自王竹溪这位世界数学与物理学权威之手。而上海翻译出版公司和电子工业出版社于1988年联合出版的《新部首大字典》更是显得端庄典雅,让人爱不释手。在上面有王竹溪先生于1980年3月写的《新部首大字典》的前言。
1.本字典依据新部首检字法所定规则顺序编排。新部首共56个,是汉字组成的单元。它们在构成汉字的作用上与英文字母构成英文单词的作用在形体上相当。用56个部首组成汉字的规则顺序见检字法说明。
2.本字典共收单字约五万字,尽可能包括古今书籍和报刊上所有的字。字的来源有四:(1)《康熙字典》中的字;(2)《康熙字典》(公元1716年出版)出版之后增加的字;(3)1956~1964年颁布的第一批简化字;(4)1977年年底颁布的第二批简化字。
《康熙字典》共有字47043个,其中有110个重见字,不同的字有46933个。《康熙字典》中约有2500个字是音义不全的字(极大多数是有音无义的字),这些字主要出现在《康熙字典》的备考中,而且其中多数很可能是错别字。字典的任务是给出音义,音义不全的字一般不宜收入,所以本字典正文中不收,而收入备考中,有2511个字。《康熙字典》出版后增加的字和两批简化字共约4000字,再加上2511个音义不全的字,总起来本字典收字51100多个。
第一批简化字公布于1956年,分四次推行,到1964年推行完毕,出版了简化字总表。为简单起见,本字典把这些简化字一律叫作1964年简化字。这些简化字只限于《新华字典》中的所有者,此外本字典仍用旧体。
第二批简化字公布于1977年,1978年上半年推行了其表中的字,但在1978年秋季经国务院下令停止使用。因此,本字典这批第一表中的简化字,叫作1978年简化字,但在字典的解释用字中不采用这些简化字。
3.本字典的标音采用汉语拼音方案,不用注音符号。凡《新华字典》上有的字,依照《新华字典》的音;《新华字典》上没有的字,依据其他资料(如《广雅》、《集韵》、《康熙字典》等)来定音。对于古字中一字多音的情况,尽可能只采用一个音,使读音简化。
4.在文字解释上力求明确。为了粗略地记录汉字的演变,凡是《说文解字》上有的字,都在字义解释的最后用方括号把《说文解字》的解释录上,并且把基本的篆字也记录上,凡甲骨文中有可考的也记录上。不录金文。
5.用新部首检字法分解五万多个汉字,基本上是无重码的,但有34对汉字的新部首次序全同,但因新部首次序全同字很少,经特殊处理,也很容易做到不重码。
由于王竹溪对汉语语言方案的独到研究和精深造诣,1980年他被聘为国务院中国文字改革委员会委员。王竹溪1983年逝世不久,在《汉语拼音方案》公布推行25周年的座谈会上,大会主持人、《汉语拼音方案》审定委员会主任胡乔木提议,与会人员全体起立为王竹溪静默志哀。学术界评论:“在现代中国,像他(王竹溪)那样既精通现代自然科学(不限于物理学和数学),又精通中国的历史文化、古文字学,并旁及中国的文献、文物、典章、制度的学者,实在找不出第二位。”
我们在日常社会生活中,常用字只有几千个,在过去使用铅字排版的时代,一般印刷厂的铸字铜模也只有10000个左右。遇到没有铜模和库存铅字的情形,就需要单独刻制铜模铸字。对于这部收字50000多的字典,就需要现刻40000个左右的字模。这是专用的一次性投资,以后印刷的书几乎不会再用。有基于此,用铅字排版印刷此书是不现实的。就是今天采用电脑排版,也要面对同样的问题。电脑软件面向一般用户,字库所收字也只有10000个左右。虽然电脑造字比刻制铜模铸字容易得多,但要另造数万个汉字绝非易事,那是一项巨大的工程。基于上述原因,王竹溪这部字典完稿后迟迟未能出版,没有一家出版社愿担此重任。最后,在王竹溪忘年交、著名学者与辞书专家杜晓庄先生的主持下,采用手写拍照制版的方式印刷,由上海翻译出版公司和电子工业出版社于1988年联合出版。
文字是一种文化的基础与核心,对每个字的释义涉及整个文化的方方面面。所以,可以毫不夸张地说,一部高水准的字典,就是整个文化的缩影。
著名学者苏仲翔在为《新部首大字典》作的序中写道:
王竹溪教授为学多方,专门博雅,两擅其长。移其测天窥地之能,能探语言文字之奥。教学余暇,殚思于汉字结构之分析,效法西文字母,为检索无重码而创造新部首,力求执简驭繁,务使汉字结构合理分割,合理拼集,以便导入电脑检索之捷径,一若西文之按字母查阅焉。王氏为学谨严,极“致广大”而“尽精微”之能事,对于历代文献与当代百科知识,兼收并蓄,融会贯通,一字一名,均作简明准确之释义。其将全部汉字,改反切为拉丁化拼音,定音纯用普通话,在吾国字典编纂史上,盖前所未有。其重视知识的全面发展,着眼人类文明继往开来之盛业,实具深远战略意义。
昔欧洲文艺复兴之杰出人物,于复古求解放,达全面之发展者,举达·芬奇为例;反观吾国历代学者,博古通今,蔚成百科全书式之伟大人物,自司马迁、杨雄而下,代不乏人。而当今之世,王竹溪教授当在其选。其触类旁通,穷原竟委,铢积寸累,四十年如一日,勇猛精进,尤非他人所及。
晚清启蒙思想家龚自珍,力倡天人性命之学,应从小学入手。其言有曰:“小学之事与仁爱孝悌之行,一以贯之已矣。”其将谨严不苟之小学,作为方法论,充类至尽,推之一切人类活动,发为《抱小》之论,所谓“寻先圣微言大义于语言文字之外者”,竹溪教授有之。
凡为科学释义,须力求正确、准确、明确。今观王编《新部首大字典》,一名之立,歧义之定,均能简要精通,期于至当,达到“每一事就本事说之,粟然止不溢一言”之境界。
复次,此一巨典,兼有《说文解字》、《康熙字典》以来汉字之总量,而去其繁冗;并采殷墟、鲁壁、汲冢、汉简所出罕见之奇字,以及悉昙、西南夷九译之语汇与夫建国后公布简化之新字。凡足以反映汉字形体、声音之演变者,均能囊括而尽有之。余意若以“应有尽有,应无尽无”八字谥之,殆不为过。
竹溪教授以一人之力,四十年间,无间寒暑,终于完成此一巨著。盖自秦统一六国文字,许慎《说文解字》辨五经异同以来,未有若是书之经营惨淡,巨细靡遗。不仅为现代汉字储存信息资料,为历史文献考订名物,且为国际外交、文教部门,提供一部体系完备之新工具,其为中华民族之瑰宝,可断言也。
总之,竹溪教授竭其心力,筚路褴褛;杜氏父子兄弟受命继志,历时七载,终告完编;而上海翻译出版公司、电子工业出版社独具慧眼,大力支援,以致克奏全功,尤足感佩。猥以愚蒙,躬逢盛世,虽于竹溪教授,未获奉手,得从诸君子后,乐观厥成,实与为荣。爰疏短论,籍申欢喜赞叹之忱于万一云尔。
著名社会学家马洪在《新部首大字典》序中写道(摘要):
王竹溪教授是国际著名的物理学家兼数学家,素以治学严谨著称。他在理论物理学的各个领域,特别是在热力学、统计物理学和数学物理方面,具有很深的造诣。王竹溪教授不但在物理、数学方面卓有建树,而且具有渊博的学识,是当代中国与世界上屈指可数的百科全书式的伟大学者。他在深入钻研物理学、数学的同时,还潜心研究汉文字学,坚持四十余年之久,夙兴夜寐,呕心沥血,默默编纂了这部250万字篇幅的皇皇巨著《新部首大字典》。
王竹溪教授遗稿《新部首大字典》,以收字之全、检索之便、释义之精、定音之准,堪称我国历代字典之楷模。
《新部首大字典》共收汉字五万一千余个,多于《康熙字典》和《中华大字典》,是目前已完成的字典中收字最多的一部,兼有繁体字、简化字,在楷书单字条目下附录有代表性的甲骨文、古文和小篆。
王竹溪教授对部首作了大胆的革新。东汉许慎编写的《说文解字》在分析小篆字形结构的基础上,按汉字形体及偏旁结构,采取了以“部”相从的收字原则,把9353个汉字分成540个部首,创立按部首收字的体例,这是我国字典编纂史上的一大发明。但《说文解字》部首数量太多,为翻检和记忆带来了诸多不便。
从《说文解字》的540个部首,到《康熙字典》的214个部首,到《新华字典》的189个部首,部首数越来越少,字形的分析归纳越来越简练,它们代表了汉字部首划分不断改革的三个发展阶段。随着科学技术的迅猛发展,电子计算机的应用日益广泛,这对汉字检索提出了新的要求。怎样使笔形和结构复杂多变的五万多个汉字能运用电子计算机自动检索?要做到这一点,关键是做到部首字母化和检字无重码。王竹溪教授作为一位杰出的自然科学家,率先探索了这一问题。
他考虑到英文检索机器化的基础是字母,因为英文都是字母构成的,于是他把《康熙字典》的214个部首改为56个部首,再依照“先上后下、先左后右”的方法来确定顺序,从而解决了汉字检索机器化的关键问题。王氏新部首充分照顾到汉字的读识习惯,撷取初小程度所能熟悉的最常用方块字、最常用笔画、偏旁作为“字母”依次编成歌诀,使检索者易学、易记、易用,具有极大的普及功能。王氏新部首的另一个特点,是充分考虑到汉字的结构特点,合理分割,合理拼接,基本消除了五万多汉字分解检索的重码现象。王氏新部首的这两大特点,首先使汉字部首笔画检字、四角号码检字、汉语拼音检字等先检字头后以页码查读音释义的两步检字,简化为如同查外文词典那样的一步检字;同时,它适于汉字的机器检索,无疑为汉字检索自动化,提供了优化方案。由于它有这些优点,因而它很有可能广泛地应用于图书资料和各类文字档案的自动检索、电报自动化、汉字印刷排版自动化等方面,不仅适用于繁体字、常用字,而且适用于数万个不常用字和冷僻字,这样不但对当代的汉字信息资料,而且对历代文献,均可自动检索。
王竹溪教授的《新部首大字典》,其所收的字和例词,广泛地涉及社会科学和自然科学领域的许许多多概念。王竹溪教授博古通今,文理兼长,在对历代文献和当代百科知识融会贯通的基础上,对字与词均作了简要精辟的释义。
王竹溪教授不仅是著名的科学家,也是著名的翻译家,他通晓多种语言文字,是汉字拉丁化和推广汉语普通话的积极倡导者之一。他将全部汉字用反切拼音改为拉丁化的汉语拼音,一律用普通话定音,这在我国字典编纂史上,诚为一大创举。
一位著名的物理学和数学权威,以个人之力编成了这一部颇具规模、颇有特色的汉字大字典,这在古今中外实属罕见。王竹溪以个人力量编纂的这部概括人类知识与中华文明的现代化的汉字大字典,正是他博学多才、治学严谨的一生的结晶和写照。任何一位只懂一门专业知识的学者,任何一个文理偏废的集体,都不可能编纂出如同王竹溪教授的《新部首大字典》这样高水平的大字典,即使勉力编纂出版,往往出现诸多错误,至少在释义上不可能保持整齐划一的高水平。由此可见,重视知识的全面发展,提倡自然科学与社会科学的融会贯通,对于人类文明的继往开来,对于教育后代、培养人才,都应当成为社会主义精神文明建设和教育体制改革的一个重要的战略方针。
在人类历史上,出现过许多百科全书式的学者,他们在人类文明史上留下了许多光彩夺目的篇章。在中国,春秋战国时代的孔子、孟子、荀子,两汉的刘向、刘歆父子、王充、张衡,北宋的沈括,明末的方以智,清初的顾炎武,近代的蔡元培;在西方,古希腊的亚里士多德,欧洲文艺复兴时期的达·芬奇,俄国的罗蒙诺索夫,都在社会科学与自然科学的广泛领域中深有造诣,有所建树。即使是专攻某一学科的专门家,由于知识本身的交叉性,也需要博学多才,才能成为某一领域的杰出学者。就经济学而言,以英国资产阶级古典政治经济学为例,其创始人威廉·配第,其理论体系的建立者亚当·斯密,其完成者大卫·李嘉图,这三位经济学家都是文理兼长的著名学者。在群星灿烂的百科全书式的伟大学者群中,王竹溪教授不愧为一颗明星。在将近半个世纪的漫长岁月中,他从事教学和科研四十余年,从事编纂《新部首大字典》四十余年,为中华民族继往开来,自立于世界民族之林赢得了荣誉,赢得了骄傲。
现代科学不断产生边缘学科,自然科学与社会科学的相互渗透融会贯通具有重要意义。建设有中国特色的社会主义,不但需要大批精通各业的专家,同时还需要大批通才、博才。王竹溪教授为我们树立了榜样。我赞同本字典的编审委员会关于在出版发行本字典的基础上设立“王竹溪博才奖”的倡议,希望本字典的出版不仅对坚持汉字改革的方向、实现汉语的规范化、实现汉字检索的自动化、实现汉语早日成为国际通用语言之一的伟大目标作出贡献,而且通过“王竹溪博才奖”的设立和评选,为促进教育体制的改革,为实现祖国社会主义的四个现代化,发现、培养和造就大批文理兼长、博学多才的卓越人才。
与王竹溪一代相知的著名物理学家卢鹤绂在《新部首大字典》序中写道(摘要):
王竹溪教授与我同行。抗战时在大西南,50年代在北京大学,我们都共过事。他长期定居北京,我则回到上海,但仍不时合作开展一些学术工作。我与他同为九三学社成员,多年来相处甚洽,情谊甚笃,诚可谓“一代相知”。
王竹溪教授一生有四大贡献。
一是关于热力学与统计物理学的基本理论及其应用,对当代世界物理学界的教学和科研作出了突出贡献。他在这方面的专著,流传甚广,迄今为止,仍属体系严谨、说理透辟的权威性著作。
二是以一丝不苟的治学精神、循循善诱的教学作风,为物理学界培养了一大批优秀学者。诺贝尔奖获得者杨振宁,已故断裂力学、金属物理学的开拓者之一陈篪同志,中国科学院周光召院长等,这些科技界的精英都是他的师承弟子。杨振宁在1983年2月致王竹溪家属的唁电中说:“竹溪师生平勤实诚正,是朋友和学生都十分敬佩的。他造就了许多科技人才,我对统计物理的兴趣即是受了竹溪师的影响。”诺贝尔奖获得者李政道在唁电中说:“我极其悲痛地获悉王竹溪教授的逝世——世界上失去了一位大科学家,中国失去了一位良师。”
王竹溪的第三项重大贡献是为中国物理学科技名词定名。他曾是中国物理学会物理学名词委员会主任,我则是副主任。他学识渊博,通晓多种语言,并能博采众议,集诸家之长,为用汉字正确贴切地翻译世界上习用的物理学与科技名词,作出了奠基性的贡献。这项工作既是对中国科技事业的重大贡献,也是对汉语吸收消化外来科技名词的一大贡献。
王竹溪教授鲜为人知的又一大贡献,就是他不惜花费四十余年的心血,发挥他博学多才、治学严谨的长处,孜孜不倦地编纂了250万字篇幅的《新部首大字典》。这部大字典,以检索之便、收字之全、释义之精、定音之准,堪称我国历代字典之冠。
王竹溪教授以毕生精力编纂的《新部首大字典》,是代表20世纪中华文明的一座里程碑。它雄辩地证明了中华民族五千年文明结晶的汉字,有着强大的生命力。在不远的将来,汉字定能成为国际性通用性文字之一。
王竹溪教授身为物理学家,但不惜成年累月、默默无闻地编纂汉字大字典,为汉字检索自动化,为汉字的字母化、规范化和推广普通话,坚持科研,坚持改革,表现了一位大科学家的智慧、才华和胆识。他直到病入膏肓之时,仍念念不忘编纂出版这部大字典。他在医院时写下遗嘱,委托他的忘年交杜晓庄同志,完成他未竟的事业。我为杜晓庄同志妥善地保存了竹溪兄的遗嘱原件,支持他全力完成竹溪兄未竟的事业,作为对竹溪兄的一个纪念。
竹溪兄精神不死,风发长存。科学泰斗,一代师表,硕果累累,桃李满天下。竹溪兄的崇高精神和不朽业绩,将同他的《新部首大字典》一样传向世界,造福后代。这是中国物理学界的光荣,也是中国人民的光荣。
国际著名学者、著名辞书编纂家《新部首大字典》编审委员会主任杜晓庄在《新部首大字典》后记中写道(摘要):
竹溪师出于爱国热忱,自抗战开始编纂这部大字典,四十余年间含辛茹苦,备尝艰辛,终以个人力量,数易其稿,精益求精,完成了如此卷帙浩繁的巨著,不能不说是学术史上的一大奇迹。
竹溪师以一位大科学家的学识和胆魄,发明了用于全部汉字的新部首检字法,这无疑是汉字检索的一个优化方案。这一方案,比较旧部首笔画检索方法和四角号码检索方法,都具有字母化和无重码的两大优点。它用于查字典,变两步为一步,查中文字典同查外文字典一样简便;它用于机器检索,消除大量的重码字。对于习惯于用旧部首笔画检字与四角号码检字的中老年读者,也许会感到某种不习惯,但是习惯是可以改变的,入门也不难。王氏新部首,实际上是学龄前儿童所能识记的最常用笔画与不超过十笔的最常用字,“先上后下、先左后右”的法则亦是学龄儿童最先掌握的书写法则。只要正确、熟练地掌握王氏新部首起笔的前两三个部首,查字的范围十分有限,翻检甚为方便。比较初学者学习、掌握两百多个旧部首与一整套的四角号码新旧法则,不知要省便多少,既没有那么多的难检字,也没有那么多的重码字。王氏新部首检字法是值得大力宣传和推广的。在信息科学中的检索法,正如在计量科学中的计量制,为了科学的发展,不能完全照顾人们的旧习惯,而相反,为了改变人们的旧习惯,还须进行带一定强制性的灌输和推广。为此,我们遵照王竹溪教授的遗嘱,没有在这部大字典中编入旧部首笔画检字表与四角号码检字表,并且希望在大、中、小学语文教学中推广新部首检字法,希望广大读者花半天、一天的时间,学习、掌握新部首检字法。
长夜难眠,遥望天际,先生的音容笑貌宛在。一代宗师,学界楷模,喻之于先生,是当之无愧的。遵先生遗愿,不克赴京执绋,它日巨著告成,是当奉献于八宝山麓,告慰于天下,激励于后人。
先生一生耕耘,桃李满天下,而晚年风骨弥坚。诗有云:“霜叶红于二月花。”春华秋实,秋实春华!
《新部首大字典》在王竹溪先生逝世五年后得以出版,并获得“中华民族文化之瑰宝”这样崇高的称赞,他也因此被誉为“文理兼通的百科全书式学者”。在字典发行的基础上,还设立了“王竹溪博才奖”,王竹溪先生在天之灵,可以放心和宽慰了。