首页 理论教育 自由词在检索策略里面怎么表示

自由词在检索策略里面怎么表示

时间:2022-02-20 理论教育 版权反馈
【摘要】:使用自由词“阿魏酸”作为标引词能准确地表达这一事物并集中其各方面的信息。总之,在没有专指规范词且组配和靠词标引均不能较好地表达其概念而影响查全率和查准率的情况下,才选用自由词标引。因此,用自由词进行标引时,应当首先考虑选择准规范词,以加强自由词的规范因素。有些自由词是配合标引作说明词使用的,如“采集季节”、“加减方”等。用这种被广大读者认可的词作为自由词标引,可方便读者检索,提高检索速度。
自由标引_连续性资源组织

检索期刊本身的性质决定了其质量的重要性。在混合标引中,自由词使用的得当与否影响到检索期刊的质量。解决好自由词应用的问题,有助于提高检索期刊的使用效果。

(一)关于自由词的解释

什么是自由词?似乎自由词本身就是一种解释。其实自由词也并非完全“自由”,也有某些限定。《汉语主题词表》将其未收进的词即词表外词定义为自由词。笔者认为自由词有以下几个特征:

《汉语主题词表》或所用专业词表肯定未予收录的。

在文章篇名或内容中出现的,而不是由标引人员主观认定或随意联想的。

混合标引中的自由词必须是主要的主题因素。

(二)关于自由词的使用[15]

按照主题标引规则,在对文献进行主题标引时,应首先选用最专指的规范词。国家颁布的《汉语主题词表》对专业文献标引来说是很有限的。现就《中文科技资料目录——中草药》所用几种工具书作一比较(见表4-1):

表4-1 三种工具书的主题使用比较

从上述比较可以看出,《汉语主题词表》收词有限,且目前也没有一本能涉及中草药化学、药理、应用、栽培、养殖等各方面知识的较完善的词表。使用组配和靠词标引方法只能解决少量文献标引问题。例如,在《阿魏酸在微循环障碍(血瘀症)兔体内的药代动力学》一文中,主要的主题概念(主题因素)“阿魏酸”不是词表中收录的词,如果用组配办法,即“阿魏+有机酸”便会产生这样的问题:阿魏酸不仅是阿魏中的有效成分,就目前的发现,它在川芎、石松等10多种植物中均存在。所以,使用组配并不恰当。如果使用上位概念标引,其上位词“有机酸”是个包含众多概念的词,给检索这一特定概念带来很大困难,所以组配、上位词标引都不能迅速、系统地进行有效检索。使用自由词“阿魏酸”作为标引词能准确地表达这一事物并集中其各方面的信息。

总之,在没有专指规范词且组配和靠词标引均不能较好地表达其概念而影响查全率和查准率的情况下,才选用自由词标引。

在混合标引中,并不是可以无节制地使用自由词。怎样选取自由词,如何尽可能避免自由词本身的缺陷——一词多义、多词一义、语义不清等,笔者根据自己的标引实践,总结出以下几点。

1.准规范词的使用

以下是两篇有关植物药和动物药的文献:《地枫皮与伪品地枫皮的U V光谱鉴定》和《如何鉴别掉皮龟甲和破碎龟甲》。

这两篇文献中的“地枫皮”、“龟甲”虽未被收入专业词表中,但却是国家药典收载的药物。药典是国家法定的并由国家主持编纂的记载药物名称、性质、形态、成分等的书籍,是药品生产、检验、供应、使用、管理的依据。如从药典中选取自由词,这类自由词是有一定约束力的。我们不妨把从像药典、各种部颁标准等有一定法律约束力的工具书中选取的词称为准规范词(quasinormative words)。准规范词使词和概念、事物对象建立起一一对应的关系,它既为读者熟悉,又从词形和词义上限定了自由词。因此,用自由词进行标引时,应当首先考虑选择准规范词,以加强自由词的规范因素。

2.专业名词和术语的应用

在主题标引中,有些词不能转换成规范词和准规范词,它们常作为专业上常用的名词、术语被收入有关工具书。也有一些自由词确实是“无依无靠”。它们有以下两个特点:

(1)使用频率较高。这些词有的可作为检索词,如“川芎嗪”、“抗衰老药”、“脉络宁注射液”等。它们或者是集中了一定数量文献的“类称词”,或者是表现了近几年的研究热点,或者是体现了近几年的学科研究新成果。使用这些自由词标引,能更客观、更准确地反映学科领域的研究现状、动态等。有些自由词是配合标引作说明词使用的,如“采集季节”、“加减方”等。

(2)约定俗成的词。这些词是广大科研人员在长期实践中积累并被普遍采用的。例如“皂甙”,现在绝大多数科技文献都使用它,尽管《汉语主题词表》称其为皂角苷。用这种被广大读者认可的词作为自由词标引,可方便读者检索,提高检索速度。

3.表达新概念名词的应用

由于科学技术不断发展,人们对客观事物的认识不断加深,许多未被人们认识的事物被人们逐渐认识;许多原来认识不深的,人们有了更深的了解。笔者在标引中经常遇到植物新种、新化合物等新词。在对新概念进行(主题)分析即分析主题的类型、主题的结构因素之后,应弄清3个问题:新词汇所反映的确实是新概念,即表达的是一个新事物,还是原有事物不同方面的新表述;新概念表达的事物和其他事物有什么关系,必要时应在标引中利用语义关系符号予以明确,对读者扩大和缩小文献检索范围极有帮助。

(三)自由词使用的管理[16]

前面提到,自由词并不意味着自由到无节制使用的程度,使用自由词应遵循下列原则:

(1)词表中已有含义与文献中主题因素相同的词,不能使用自由词。

(2)选取自由词,其汉字必须运用准确,能正确表达概念内涵。

(3)应规定几种标引参考用工具书(如《中文科技资料目录——中草药》对其有明确规定),把自由词尽量限定在一定范围。

(4)对新词要作记录,以便以后应用时对照标引,特别像植物拉丁名、事物的英文名称这种唯一性的词,以避免一种事物多种词汇表达(一义多词),力求达到词形、内涵的统一。

(5)必要时应标明检索词和非检索词之间的语义关系,指导读者利用检索途径。如将人们习惯用的“艾滋病”引见到“获得性免疫缺陷综合症”。

总之,主题标引工作是信息处理工作中的重要一环。在混合标引中准确、有限度地使用自由词,可以增强检索期刊的功能,获得更佳的使用效果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈