首页 百科知识 网络信息资源的组织方式

网络信息资源的组织方式

时间:2022-09-30 百科知识 版权反馈
【摘要】:搜索引擎组织网络信息主要采用主题树和数据库两种方式,也有称使用语词组织知识和使用分类法组织知识。而数据库组织方式,就是将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询,就可找到所需要的信息线索,并通过信息线索直接链接到相应的网络信息资源。笔者曾对主题词表在网络信息组织与检索中的应用进行调查,有43种词表已成功运用于组织网络信息资源。

四、网络信息资源的组织方式

对于网络信息资源来说,其组织方式主要有[28]

1.索引擎信息组织方式

搜索引擎组织网络信息主要采用主题树和数据库两种方式,也有称使用语词组织知识和使用分类法组织知识。所谓主题树组织方式,就是将信息资源按照某种事先确定的概念体系,分门别类地逐层加以组织,用户通过浏览的方式层层遍历,直到找到所需的信息线索,再通过信息线索链接到相应的网络信息资源。现有的提供目录分类式(或称主题指南、列表浏览)查询功能的搜索引擎就采用这种方法组织信息。而数据库组织方式,就是将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询,就可找到所需要的信息线索(即相关站点链接),并通过信息线索直接链接到相应的网络信息资源。

2.学科导航库方式

这种方式是根据特定的目标,选定信息资源的学科领域,对有关的网站网页进行搜索和收集,加以鉴定核实,并对核实后的网址进行合理组织,使之能够提供检索、浏览和链接的信息集合。它与搜索引擎的主要区别在于,它属于专题性和学科专业性的,系统性和易用性强。虚拟图书馆对网络资源组织是优越于搜索引擎的关键环节,它针对某一学科或领域的研究者的需要,将Internet上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URLs(即统一资源地址,包括Http、Gopher、Ftp、Usenet等),系统地组织起来,存放于某一网页,供用户浏览或者检索。用户在访问某一学科的虚拟图书馆的网页时,通过激活相关的网络线索即超级链接,就可以浏览到大量相关资料。

其知识组织方式一般有两种,第一种是分类方式(包括学科分类与资料类型分类),其一是按照学科性质,根据学科概念体系,依学科分类的方法组织网上信息,用户可按树状结构逐步找到所需信息;二是按照电子资源类型,即将搜集到的资源按照综合信息、研究机构、期刊与出版物、会议通告等外在形式进行分类组织,用户可以按资源类型找到所需信息。

第二种为数据库方式,即利用数据库技术,依据一定的索引语言抽取一个或几个标识点作为检索点,形成检索数据库或指示数据库供用户检索。数据库形式可以满足用户的特性检索,用户可以比较快地找到所需信息。有的图书馆在组织学科网络信息时,既采用分类组织,又采用了数据库方式,以增强导航库的功能。

3.分类法方式

这种方式是以文献分类法为工具的网络资源检索服务系统,从学科角度揭示网络信息,成为组织网上学术性知识内容的主要应用模式。陈树年在《文献分类学》一书中提出文献分类法用于网络信息资源组织的优势是:①文献分类法几乎是综合性分类法,涵盖人类知识的各学科领域,具有很高的通用性,对于科学、学术信息的组织更有独特的能力;②文献分类法的编制和运用既有成熟的理论的技术支持,也积累了丰富的实践经验,严格的词汇控制和完善的语义网络,有助于对网络信息的筛选和组织;③文献分类法是一个完整的知识分类体系,类目之间严密的逻辑关系,全面揭示了知识的内在联系,非常适合于浏览和对主题进行分类控制;④文献分类法有着长期的使用历史,并在各种文献数据库中广泛应用,有着深厚的用户基础;⑤文献分类法正在向电子化和分类主题一体化方向发展,更适合于对网络信息的组织。[29]

传统文献分类法在网络中的应用主要表现在:①用于联机浏览检索;②用于非文本信息的组织;③用于超文本系统的管理;④作为网络信息组织的通用工具;⑤促进分类主题一体化。

一些著名的分类法,如DDC、LCC、UDC、《中图法》等都已经不同程度地应用于网络信息的分类组织。当然,传统分类法要应用于网络信息组织,必须进行技术改造和不断创新发展,如分类法网络化和易用性方面的改造等。

4.主题法方式

其主要体现为:①关键词法的应用,目前由搜索引擎软件自动建立的网络信息资源索引数据库所支持的就是关键词检索。关键词法具有标引速度快,成本低,不依赖专职标引人员,可由作者或机器自动标引,不存在人为性或滞后性,能及时应用最新的提法以及最新词汇等优点,但是,这种关键词检索的致命缺点就是检准率太低。人们提出网络信息检索应导入受控语言机制,使用后控词表即“标引不控制+检索控制”模式。②主题词表的应用,少数搜索引擎中提供主题词检索方式,在用户界面上,可直接浏览主题词表,从中选出主题词,作为搜索引擎的检索提问。用户可以在检索界面中修改检索提问,也可返回到主题词表界面重新选择主题词。③标题词表的应用,通过标题词表规范用户的检索表达式,在得出检索结果的同时,还可以提供相关词作为用户进一步检索的线索,用户可自由进行扩检和缩检,从而提高检索效率。

笔者曾对主题词表在网络信息组织与检索中的应用进行调查,有43种词表已成功运用于组织网络信息资源。绝大多数的叙词表检索界面上显示了词间关系,用户使用检索入口词,可查询叙词表中的上、下位词及相关词和用代关系,通过不断修正检索提问提高检索效率,也可直接按字母顺序浏览主题词表,从中选择主题词,作为搜索引擎的检索入口词。用户可以在检索界面中修改检索提问,也可返回到主题词表界面重新选择主题词。还有叙词表可选中叙词,直接链接相关网络。其共同的特征是:词表内超文本导航。以ERIC叙词表为例,以“educational administration”作为入口词检索叙词表(见图7-1),显示了该主题词的记录类型、定义注释、类别、上位词、下位词、相关词以及替代词,并可用该词直接链接,通过点击“img10”图标就可查找ERIC资源,省略输入检索词的步骤。

5.本体方法

本体是网络信息组织与检索工具的理想选择,主要原因是:①本体关于领域知识的共同理解和描述使得现代网络信息组织是建立在语义信息而不是语法信息基础之上的,它是以信息(或知识)内容或其本质特征为依据进行信息组织的有效方法,它在优化网络信息组织的同时也必将促进信息组织向知识组织的转变;②信息组织的目的是建立有效的信息系统,从而便于信息的检索和利用,而本体对于概念及其之间关系的精确描述可以极大地提高信息系统的检索效率;③本体面向计算机和网络的特点及其形式化描述使其能更好地满足现代信息组织,特别是网络信息组织的需要[30]。本体的主要功能在于有助于对信息资源内容意义的精确理解,实现系统的互操作、复用和共享。当前主要应用于数字图书馆与信息检索之中。

img11

图7-1 ERIC叙词表检索界面

有研究者提出了构建领域本体的知识工程法包括5个步骤[31]:①确定本体的领域与范围;②列举领域中重要的术语、概念;③建立本体框架;④设计元本体,重用已有的本体,定义领域中概念及概念之间的关系;⑤对领域本体编码、形式化,选用合适的本体描述语言对上述建立的领域本体进行编码、形式化。还有研究者提出领域知识本体构建的基本过程[32],包括本体需求分析、本体构建规划、本体信息获取、本体概念及关系确定、本体形式化编码、本体的评价、本体的进化和本体的表示,并对其中的基本流程、内容与方法进行梳理和分析,强调了本体的进化、本体的构建是一个不断完善的、螺旋上升的、有序而系统的发展过程,进化是本体的生命所在。

由于叙词表与本体有许多相同之处,而且某学科领域的叙词表包括本学科领域中相对比较完整的术语(叙词),是经过本领域专家多年的有序组织与经验积累的结果,这些术语(叙词)为领域本体中概念的创建提供借鉴,词表中注释与词间关系也为领域本体中概念的属性、实例以及关系的创建提供借鉴,因此利用叙词表构建领域本体成为简便、易行且实用的方法。国内研究主要集中在利用专科叙词表,如《艺术与建筑叙词表》、《国防科学技术叙词表》、《医学主题词表》等创建领域本体。如有研究者介绍了阿姆斯特丹大学信息科学利用《艺术与建筑叙词表》建立了描述艺术对象的本体实例[33],采用Protégé-2000作为本体编辑工具,RDFS作为表示语言。艺术品概念用类表示,叙词集转换为类的属性,用RDFS Properties表示,限定词转换为Subproperties,并给出了关于古典家具的Ontology建立步骤:①建立家具的描述模型,一个家具实体可以用25个元数据来描述;②将家具属性与叙词表的特定子集联系起来,使其能成为家具属性的值;③添加领域知识,特别是能够约束家具属性值的知识。

另外,网络信息组织还采用文件、超文本与超媒体、网站等模式。因特网的信息组织,首先是要将网外丰富的信息资源电子化,投入网上,形成网上的各种文件[34];超文本、超媒体既是一种新型的文本信息组织方式,也是一种有别于传统检索技术的新型信息获取方式,它将网络上相关文本的信息存贮在许多节点上,节点间以链路相连,节点表示信息单元、片段或组合,而链表示节点间的同义、反义等关系,使用户可以从任一节点开始,根据信息间的联系,从不同角度浏览和查询信息;网站是网络信息资源的重要组成部分,是一种用标记语言(描述性语言)将信息组织好,再经过相应的解释器或浏览器翻译出的包括文字、图像、声音、动画等多种信息的组织方式。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈