首页 百科知识 叙词表的起源及发展历程

叙词表的起源及发展历程

时间:2022-02-26 百科知识 版权反馈
【摘要】:叙词法起源于20世纪50年代末,我国也称为主题词语言,是在单元词法的基础上发展起来的一种新的检索语言。在一些欧美国家,叙词表是作为主要的检索语言。
叙词表的起源及发展历程_多语种叙词本体

1.1 叙词表的起源及发展历程

叙词(thesaurus)也称描述词、叙述词,是经过规范化处理的,以基本概念为基础的表达文献主题的词和词组,具有概念性、描述性、组配性。经过规范化处理后,还具有语义的关联性、动态性、直观性,它是描述文献资料主题的一种标识符号。

从信息检索的角度来说,叙词是作为一种检索语言使用,所以在一些场合也称为叙词法。叙词法起源于20世纪50年代末,我国也称为主题词语言,是在单元词法的基础上发展起来的一种新的检索语言。它以单元词语言作为直接基础,又综合了标题法、分面组配式分类法等多种标引语言的原理和方法,包括:

①在单词组配上保留了单元词法的基本原理,在单元词法的完全后组和反记法的技术基础上发展出后组和倒排文档技术。

②采用标题法的基本方法,对语词进行严格控制的规范化方法,以确保语词能够与概念一一对应。此种规范方法在单元词法对单元词的控制中也得以发展。

③适当地采用了标题法中先组方法,以及分面组配式分类法中的概念组配原理,取代单元词法中的单纯字面组配,克服了某些复合主题分拆和组配后产生的意义失真的缺点;在采用标题法的参照系统的基础上,进行了进一步的完善,包括用、代、属、分、参参照。

④采用体系分类法的学科分类和等级结构技术编制了叙词范畴索引、词族索引和词汇分类表;在关键词语言的轮排技术的基础上编制了轮排索引,从多个方面显示了叙词间的相关关系,以确保准确、全面地选用叙词进行标引和检索。

叙词法在吸取了这些信息标引语言的优点之后,已经发展成为一种性能优越的现代检索语言类型。

第一部叙词表出现在20世纪50年代末期,此后,随着计算机在信息检索领域的应用,叙词表的编制得以迅速增长,使叙词语言逐步发展成为受控检索的主要语种。

1.1.1 叙词表的发展

1.1.1.1 国外叙词表的发展

在国外,叙词法的研究开展得较早,可以追溯到19世纪下半叶。在一些欧美国家,叙词表是作为主要的检索语言。欧美研究叙词法的著名人物主要包括:

卡特(A.Cutter,1837—1903),美国图书馆事业上最杰出的贡献者之一,19世纪下半叶图书馆事业的领袖、标题法的始祖。其代表作《词典式目录编制规则》(Rules for a Dictionary Catalogue)(1876年第1版,1904年第4版)为图书馆学文献中的一个里程碑,其中“议题款目”规则部分是世界上第一部字顺主题目录的法典。

卢恩(H.P.Luhn,1896—1964),情报科学的先驱,关键词索引和自动标引的创始人。被公认为以下几个方面的创始人:题内关键词索引(1958),计算机定题服务(SDI)系统(1958),计算机编码系统,利用统计学方法进行自动标引和自动编制文摘。

克莱夫顿(C.W.Cleverdon,1914—1997),英国图书馆员和情报学家,主持领导了世界上首次大规模的、以测试语言在检索中的效益及对情报检索系统的影响因素为目的的克兰菲尔德试验,并在试验中首次采用的“检全率”、“检准率”、词汇的“专指性”、标引“详尽程度”等概念以及试验方法,之后被情报界广泛采用。

淘勃(M.Taube,1910—1965),设计出单元词卡片,提出单元词组配标引法,计算机情报检索的奠基人。他最早利用数学与计算机科学成果,提出用布尔逻辑的“与,或,非”操作符联结概念,以便与一个机器储存的信息库进行通信的思想。

兰卡斯特(F.W.Lancaster,1933—),现代情报词汇控制研究方面的带头人,以其撰写的图书馆学情报学著作而闻名。他于1968年完成的对美国国家医学图书馆MEDLARS系统的评价是继C.W.Cleverdon领导的克兰菲尔德试验后情报检索领域的又一重要试验,其关于标引的详尽性和标引语言的专指性对检索效率的影响方面的发现和建议促使了MEDLARS系统和医学主题表(MeSH)的改进与完善。

萨尔顿(G.Salton,1927—1995),20世纪60年代以来机械化情报检索系统领域的发明家、试验家和促进者。他创造的自动化情报检索系统原型SMART,进行词的自动化规范处理、自动聚类、统计式相关测量,自动编制含同义词、上下位词、同族同级词的概念词表。

美国人穆尔斯(C.N.Mooers)在1947—1950年,创造了叙词(descriptor)、叙词法(descriptor method)、情报检索(information retrieval)、情报检索系统(information retrieval system)等专门术语。

1.1.1.2 国内叙词表的发展

我国主题法的历史可以追溯到古代“用韵以统字,用字以系事”的类书。我国明代永乐年间(1403—1408年)编制的《永乐大典》,就是带有主题法性质的检索工具。它的主题法思想比英国1856年克里斯塔多罗(Crestadoro)提出的标题字顺标识系统要早448年。但在封建社会主题思想发展缓慢。到1840年以后,随着西方分类法传入我国,主题法又重新得到发展和提高。1934年开始诞生了我国第一部主题法词表——沈祖荣的《标题总录》,该书以《美国国会图书馆标题表》为蓝本,结合中文书籍的需要而编成,分上、下两册,由武昌文华图书馆专科学校出版,上册700余页,以英文为主,后附中文;下册以中文为主,后附英文,但由于“七七事变”发生而未能正式出版。

中华人民共和国成立以来,20世纪50~60年代,分类法研究成果比较突出,主题法研究较弱,但编制了我国第一部实用型标题表,即1964年我国编制的《航空科技资料主题表》(第1版)。叙词表在我国的大规模编制始于20世纪70年代。1971年出版的《航空科技资料主题表》(第2版)是我国第一部叙词表。我国叙词表编制的重要工作,首推1975年国家“748”工程的配套项目《汉语主题词表》(以下简称《汉表》)编纂工作的正式开始,全国先后505个单位1 378位专业工作者参加了编表工作,至1980年3月正式出版,3卷10个分册,共收词108 568条,到目前为止,在国际上仍为收词量最大、唯一包括自然科学和社会科学领域的大型叙词表,为国内叙词表的编制培养了大批人才,此后出现了大量的专业叙词表。以下按年代列出我国目前编纂的叙词表。

1964年:《航空科技资料主题表》,新中国成立以后第一部实用型标题表。

1971年:《航空科技资料主题表》(第2版),我国第一部叙词表。

1976年:《科学技术用语叙词表》。

1977年:《电子技术汉语主题表》、《航空科技资料主题表》(三册),《常规武器专业主题词表(试用稿)》。

1978年:《国防科学技术主题词典》,我国第一部以英文作为主要排检依据的主题词表;《原子能科技资料主题词典》。

1979年:《机械工程主题词表》、《汉语主题词表》(三卷10个分册)。

1981年:《冶金专业叙词手册》。

1983年:《常规武器工业分面叙词表》、《农业主题词表》、《化工汉语主题词表》。

1984年:《英汉对照医学主题词注释字顺表》(1984年版)、《图书情报学及相关学科主题词表》、《地质学汉语叙词表》、《仪器仪表主题词表》、《纽约时报主题词表》。

1985年:《国防科学技术叙词表》、《船舶工业范畴表》、《石油工业汉语主题词表》、《国防科学技术叙词表航天专业范畴表》、《林业汉语主题词表》、《联合国教科文组织叙词表》(图书馆学、情报学部分)、《医学汉语主题词字顺录》、《技侦情报主题词典》、《国防科学技术叙词表》(英汉索引)、《档案主题词简表》、《国防科学技术叙词表》(字顺表、型号表)、《广播电影电视专业主题词表》、《交通专业汉语主题词表》。

1986年:《测绘科学技术主题词表》(试用本)、《海洋科学主题词表》、《计量学与测试技术主题词表》、《国防科工委档案主题词表》、《汉语主题词表》(缩减本)、《煤炭科技文献检索词典》。

1987年:《矿山机械主题词表》、《教育分面叙词表》(分类部分)、《公安部文件主题词表》、《国际共产主义运动主题词表》、《钢铁工业主题词表》、《水利水电科学技术主题词典》、《新闻叙词表》、《军事公文常用主题词表》、《国防科学技术叙词表》(汉英索引)、《光学汉语主题词表》(初稿)、《汽车工程叙词表》、《城乡建设汉语叙词表》、《中医药主题词表》、《建筑材料工业主题词表》。

1988年:《有色金属工业叙词简表》、《程兵技术装备叙词表》、《军事情报主题词表》、《中国档案主题词表》(试行本)、《国际军事约章主题词表》、《铁路汉语主题词表》、《后勤科学技术主题词表》、《稀土叙词表》、《生物学主题词表》、《纺织汉语叙词表》(征求意见稿)、《装甲兵常用主题词表》、《标准文献主题词表》。

1989年:《环境科学叙词表》、《自动化科学技术主题词表》(上、下册)。

1990年:《军用主题词表》(三卷)、《光学叙词表》、《计算机科学技术汉语叙词表》。

1991年:《水产科学叙词表》、《军用公文主题词表》、《汉语主题词表》(自然科学修订本4册)、《资源科学主题词典》。

1992年:《中国地震科学主题词表》、《艺术科学叙词表》、《军用后勤主题词表》。

1993年:《军用医学主题词表》、《军用主题词释义词典》、《世界汉语教学主题词表》、《公文主题词表》、《教育主题词表》、《航空航天医学主题词表》、《邮电通信技术主题词表》(英汉对照表)。

1994年:《物理学汉语主题词表》、《石油主题词表》(2个分册)、《农业科学叙词表》(4个分册)、《民航主题词表范畴纲目》、《军队档案常用主题词表》、《生物分类叙词表》(3个分册)、《计算机科技英语主题词表》、《中国分类主题词表》(2卷6个分册)。

1996年:《音像资料叙词表》、《兵器科技档案主题词表》(两册)、《数学汉语主题词表》、《中国档案主题词表》、《环保保护档案主题词表》、《地理科学叙词表》、《航天科学技术叙词表》、《邮电公文主题词表》。

1996年:《中国中医药学主题词表》、《管理科学主题词表》、《社会科学检索词表》。

1998年:《水利水电科技主题词表》、《军队政治工作主题词表》、《中国铁路叙词表》、《公文主题词表》、《大气科学主题词表》。

1999年:《标准文献主题词表与分类法对照索引》、《黄河水利委员会公文主题词表》、《军用公文主题词表》。

2000年:《水科学和渔业叙词表》。

1.1.2 叙词表的特点

在详细了解国内外叙词表的发展历史之后,我们不难发现,叙词表的发展具有以下几个特点:

①叙词语言已经成为当今情报检索语言领域的主流。在国外,大量的综合性或专业性的数据库均是以叙词表作为主要的检索语言,同时也在各个领域建立了大量的叙词表。在我国,分类语言一统天下或叙词语言只在很少量的图书情报研究部门使用的情形已经彻底改变,叙词已经发展成为情报检索语言中同分类法并驾齐驱的检索语言。叙词语言图书、档案以及情报领域的使用亦日趋普及。

②叙词表的编制和管理已经由手工阶段转向计算机化阶段。当前,传统的纸版叙词表的网络化,不仅适用于组织纸质文献,而且还适用于这些学科、专业的网络信息的标引和检索,满足了人们揭示不同格式、载体的同类资源时采用同样标准的需求。同时,网络叙词表的编制与开发是叙词语言的研究重点。在国外,已经建立了相当多的网络叙词表。

③叙词表的学科范围逐渐扩大。随着传统纸版叙词表的纷纷网络化,面向传统的某学科、某专业或特点领域的叙词表已经不能够满足人们检索的需求,各种覆盖多学科、多领域、多主题的网络叙词表得以建立。其中甚至包括面向大众生活的网络叙词表。

④叙词表的多语种化。随着全球化进程的加速,全球范围内的政治、经济、文化之间的信息交流日趋频繁,必然需要多语种叙词表对其进行组织和检索。多语种叙词表为不同语言的交流提供平台,网络叙词表向多语种词表发展成为其发展趋势之一。

⑤叙词表的兼容问题日趋得到重视。在叙词表的编制过程中,政治、经济、时间、地域、专业以及其他因素的影响较大,即便一部通用的叙词表要完全满足文献标引深度和广度的需要也是不可能的,必须在叙词表之间实现兼容,才能达成统一,满足文献标引和检索的需要。另外,文献的检索与利用进入联机阶段以后,作为计算机使用的叙词语言,其兼容问题也显得尤为重要和迫切。

⑥叙词表的结构变化和功能不断增强。叙词表是在单元词的基础上发展起来的,在发展过程中又综合了标题法、分面组配式分类法等多种标引语言的原理和方法,吸取了这些标引语言的优点。如在单词组配上保留了单元词法的基本原理,在单元词法的完全后组和反记法的技术基础上发展出后组和倒排档技术;采用标题法的基本方法,对语词进行严格控制的规范化方法,以确保语词能够与概念一一对应,使得叙词表的结构日益简化,功能却更加强大。

1.1.3 叙词表的发展趋势

截至目前,以及在今后的很长一段时间内,叙词法作为主题词法的主流检索方式这一地位依然不会改变,其检索方式仍将在人们的控制下进行管理,但其编制、管理等方面会表现出以下趋势:

①从面向单学科或专业领域用户转向面向大众,使用范围更加广泛。鉴于叙词语言在情报检索领域的巨大作用,叙词表的编制不再单单只是针对专业科技者的使用。另一方面,信息技术的发展使得叙词表的编制变得更加简易与快捷,网络上已经出现大量面向普通大众的叙词表,如COOK'S Thesaurus(http://www. foodsubs.com)就类似一部烹调百科全书,包含了成千上万的烹调原料及厨房工具,并附有图片,形象直观。

②出版方式变化趋势。早期编制的绝大部分叙词表,由于只是单纯的行业内使用的科技资料,往往只由比较权威的情报研究部门进行编制,也不作为正式的出版物由出版社出版。20世纪80年代末期以后,随着叙词表使用范围的日趋扩大,许多出版社也开始正式出版叙词表,使得更多的人也能看到这些成果。

③编制单位及参与者变化趋势。起初,叙词表的编制多是一项极其浩大的工程,需要调配大量的人力、物力以及财力才能完成。如《汉语主题词表》的编写,是在先后组织了全国505个单位的1 378位专业工作者,历时5年才完成的。这种工作量往往非一般科研部门所能承受。如今,因为网络通信技术的发达,人们之间的联系变得相当便捷,叙词表的编制工作更多的只是通过网上合作,而不是组织大量专业工作在一起才能完成的。同时,由于网络的开放性,许多普通人员也可以通过互联网就某一叙词表的编制提出自己的意见或建议。在这种情况下,叙词表的编制只需由某一领域的研究所就能完成。

④叙词表的修订趋势。人类社会在不断进步,语言也在不断丰富。一部优秀的叙词表不是在编制完成之后就停步不前,而是在不断地进行新词的添加,不适用词的删除。如《汉语主题词表》,中国科技情报所于1991年对自然科学部分进行了修订,增补新词8 221条,删除不适用的词5 434条。1994年,又由北京图书馆主持,将《中国图书馆分类法》类目与《汉语主题词表》结合对应,编制出版了《中国分类主题词表》。正因如此,叙词表才显示出其强大的生命力。

⑤叙词语言的发展趋势。叙词语言是以单元词法作为直接基础,在综合标题法、分面组配分类法以及其他多种标引语言的原理和方法的基础上发展起来的。随着时代的进步,各种先进信息技术的应用,叙词语言会吸取更多优秀标引语言的特点,对自身不断进行补充和完善。如分类法与主题法的相互结合,即分类主题一体化,是当今情报检索语言发展的重要趋势。自20世纪60年代中、后期以来,出现了几十种分类主题一体化的词表。这种新型情报检索语言的特点是叙词语言与分类语言的概念系统、标识系统、参照系统、索引系统实现了兼容,把两种或两种以上的词表融为统一体,充分发挥各自的优点,达到最佳的整体效果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈