首页 理论教育 网络信息检索常用的分类法

网络信息检索常用的分类法

时间:2022-02-23 理论教育 版权反馈
【摘要】:②要以连续出版物的内容属性或特征作为分类的标准,也称为划分标准或依据。分类的目的是在于对连续出版物分门别类的组织,其作用主要功能有两个,一个是建立分类检索与浏览系统,而是用于连续出版物的分类排架。具体而言,就是一种直接用规范化语词作为概念标识、按字顺序列组织、并用参照系统等方法间接显示概念之间相互关系的揭示连续出版物主题内容的方法。
内容组织方法_连续性资源组织:模式演变

(一)分类法

1.分类法的含义和作用

连续出版物的分类法,它是依据一定的分类体系,根据连续出版物的内容属性和其他特征,对连续出版物分门别类地、系统地组织与揭示的方法。这一概念包含以下几层含义:①必须依据分类法与分类标引规则,才能保证分类的准确性与一致性,实现资源共享。分类工具主要指分类法,又称分类检索语言。②要以连续出版物的内容属性或特征作为分类的标准,也称为划分标准或依据。③是对纷繁无序的连续出版物分门别类地加以组织和揭示,从而使之系统化,为用户从科学角度查找连续出版物提供检索途径,也为收藏单位进行分类排架提供依据。

分类的目的是在于对连续出版物分门别类的组织,其作用主要功能有两个,一个是建立分类检索与浏览系统,而是用于连续出版物的分类排架。

2.分类法的类型

按其编制的结构形式,通常可分为体系分类法、组配式分类法、体系—组配式分类法三大类型。

(1)体系分类法

体系分类法是一种传统的分类法类型,因其通常有一个严密的类目体系等级结构,各级类目原则上按概念逻辑划分的方法层层展开,所以也称为等级分类法、层次分类法等,是一种将所有的类目组成一个等级系统,并采用尽量列举的方式予以编制的分类法。

体系分类法的优点:概念直接表达,直观明确,不易产生歧义;在分类浏览检索中可发现所有类目。缺点:难以充分揭示复杂专深主题和新主题,即容纳性较差;详尽的列举导致篇幅巨大,使用不便。DDC、LCC和《中图法》、《科图法》、《期刊表》都是传统意义上的等级列举式分类法。

(2)组配式分类法

分面组配式分类法也称分面分类法、分析-综合分类法,是根据概念的分析与综合的原理,将概括文献、信息、事物的主题概念组成“知识大纲—分面—亚面—类目”的结构,按一定的规则、通过各个分面类目之间的组合来表达连续出版物主题的一种分类法。

组配分类法的优点:具有极大的灵活性,即用较少的类目可以组配出大量新的、复杂的主题并提过多途径检索;可从过个方面反映概念的含义,这在网络资源知识组织方面具有较好的应用前景。缺点:组配和标记技术过于复杂且缺少直观性,大大降低了其实用性;分面结构易导致知识系统的破坏,而这正是体系分类法的重要性能;分类浏览检索效果远不如体系分类法。因此,全面组配式分类法极少被使用,其分面分析和组配技术更多的是为体系分类法所吸收,并被用来改善自身的性能。《冒号分类法》(CC)、《布立斯书目分类法(2版)》等都是分面组配的代表。

(3)体系—组配式分类法

体系—组配式分类法亦称半分面分类法,是一种在等级体系分类法的基础上引入分面分析和组配技术所形成的分类法结构模式。

该模式以等级体系分类法为基础,在确保分类知识系统性的前提下引入分面分析和组配技术,以提高体系分类法对新主题、复杂主题的描述能力和灵活的检索能力,因此,这种分类法具有体系分类法和组配式分类法的长处。实际上,大多数等级体系分类法如UDC、DDC、LCC以及我国的《中图法》等都在不同程度上吸收了分面分析和组配技术,纯粹的体系分类法已不多见,如《中图法》运用类目仿分、设置专类复分表和通用复分表提高标引的专指度;使用主类号直接组配等表达新主题等。

(二)主题法

1.主题法的含义和作用

连续出版物的主题法,它是用语词汇来表达概念,将各种概念按字顺排列。具体而言,就是一种直接用规范化语词作为概念标识、按字顺序列组织、并用参照系统等方法间接显示概念之间相互关系的揭示连续出版物主题内容的方法。主题法与分类法对于概念的分析过程是一致的,不同之处在于分类法是用号码(分类号)作为概念标识,用分类体系和分类号直接显示概念之间的相互关系,而主题法是用语词作为概念标识。

分类法的基本功能是建立分类检索系统与进行分类排架,而主题法不用来组织连续出版物等文献,不用于排架,只用于组织各种检索工具(如索引等)或建立检索系统。

2.主题法的类型

依据其主题概念的语词标识的构成原理和特征,主题法一般可分为标题法、叙词法和关键词法三大类。

(1)标题法

标题法是最早产生的一种主题法,它是一种用规范化的自然语言语词作标题,直接表达连续出版物主题概念,按照标题字顺排列,并用参照系统(现在的标题法已采用类似叙词法的参照方式)显示标题词间的关系的主题法。标题(词)是标题法中表达资源主题的标识,是自然语言经过规划范处理的词或词组,通常为比较定型的事物名称。

标题法特性检索功能较强,标识直观、含义明确,易于使用,其主要缺点就是由于采用标题的列举方式和先组方式,概念表达能力受限,检索途径少,通用性较差。目前我国很多文献信息机构使用《国会图书馆标题表》LCSH标引西文文献,西文连续出版很多就是采用LCSH来标引。

(2)叙词法

叙词法是在吸取了标题法和单元词法以及分面组配分类法等优点的基础上,于20世纪50年代末产生并发展起来的一种主题法。在我国,叙述法又称主题词法,是一种一规范化的自然语言语词为叙词(我国多称主题词)并通过叙词概念组配方式来表达连续出版物主题概念的主题法。而所谓叙词是指取自自然语言但经过规范化处理的、以基本概念为基础的表达资源主题的词或词组。

叙词法除了具有主题法的共同优点外,还因采用组配方式,可以实现多向成族,多途径检索,多因素组配,灵活地扩检、缩检或改变检索范围;能以较少的语词表达较多的概念、交专指的概念以及新概念;且语义组配准确,族性检索功能较好。其主要缺点是:编制和是用的难度较大;组配语义的明确定稍差。我国比较著名的叙词表有《汉语主题词表》后演化后的《中国分类主题词表》,目前中文连续出版物的主题法大多采用《中国分类主题词表》。

(3)关键词法

一般认为,现代意义上的关键词法也产生与20世纪50年代。关键词法是一种会直接以连续出版物中能表达主题概念的关键词作为标识的准主题法,或关键词法是由计算机或人工从连续出版物中抽取关键词作标识,按字顺排列并提供主题检索途径的方法。而所谓关键词,是指出现在连续出版物的题名、摘要或正文中,能够表达连续出版物主题并具有检索意义的语词,如期刊论文就广泛采用关键词作为一种标识和检索方法。

与标题法和叙词法相比,关键词法具有以下两大特点:是自然语言,不作规范化处理;一般不通过编制受控词表(关键词表)进行词汇控制,不显示词间关系,而只通过编制禁用词表来控制抽词。

(三)传统连续性资源组织方法的网络化

1.分类法的网络化应用

传统的分类法除了能组织传统的连续出版物,同样也可用于组织网上电子期刊等网络连续性资源。以《中图法》(第五版)在《中文科技期刊数据库》(重庆维普)中的应用为例来说明传统分类法在网络资源中的应用。从图7-1中可以看出,《中图法》在《中文科技期刊数据库》(重庆维普)中的应用基本上是照搬,但是,“中国知网”(10大学科)和“万方”(8大学科)这两个著名的期刊数据库则和“重庆维普”不同,采取的是按学科分类的方法,还有国外有名的期刊数据库“Elsevier全文电子期刊数据库”则将学科分成了农业和生物科学、艺术和人文学科、生物化学等22个大类;“Wiley电子期刊全文库”则将学科了生命科学与医学、数学统计学等十几个类目。

图7-1 《中图法》在重庆维普数据库中的应用

尽管传统分类法,包括国外的DDC、UDC和LCC有着类名规范、族性检索功能强、标识系统规范等优势,但是它的分类对象毕竟不是实体的文献,网络资源的诸多特征导致传统分类法在组织网络资源时还是存在一些不足之处,所以,为了适用网络环境,可以从这几个方面对对传统分类法进行完善和改进:(1)降低分类难度,控制类目的深度;(2)注重自然语言和网络词汇的应用,使类目通俗易懂;(3)解决好兼容性和国际通用型,注重各分类法之间号码的转化;(4)分类主题一体化;(5)通过分面分析和多重列类多类目进行多标准划分,实现多维揭示;(6)用户界面清晰友好,提高检索效率。

2.主题法的网络化应用

(1)关键词法的应用

关键词是一种自然语言,它具备选词快捷简便、更新及时等优点,它是目前搜索引擎软件自动建立的各类索引数据库支持的一种重要的检索方式。但是,由于它由于未进行同义词及反义词控制,未揭示词间关系,导致检准率低,所以,有人提出应导入受控语言,即“标引不控制+检索控制”模式,是改进关键词法性能的比较有效的措施之一。

(2)标题词法的应用

标题词法在网络信息组织中的应用可分为两种情况,一种是检索前使用,即通过网络工具提供的标准标题词及相关词汇作为检索点,点中超链接得到检索结果。另一种是检索后使用,即用户得到检索结果后,提供相关词作为用户进一步检索的线索(二次检索),用户可自由扩检和缩检,从而提高检索效率。

(3)叙词法的应用

叙词法在网络环境中的应用其实就是网络叙词表,它是一种新型的网络信息组织工具,用超链接的方式予以显示,借助Web浏览器介质进行访问。网络叙词表以其独有的知识组织体系和语义结构在组织和检索网络信息资源方面发挥着重要的作用,也为用户规范检索提供了依据。网络叙词表在我国研究还比较少,国外发展较快,应用比较广泛,不同的划分标准可以产生不同的类型(见表7-1)。

表7-1 网络叙词表具体类型

比较起来,创建了辅助表的XML格式的嵌入检索系统的网络叙词表,更能够适用网络信息资源组织与检索的需要,具有更强的适应性。

总而言之,叙词表改造的方向应该是:强化叙词表检索功能,使用主题词改善用户检索界面,向易用化与兼容化(互操作)发展。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈