首页 百科知识 网络环境下的档案信息组织

网络环境下的档案信息组织

时间:2022-10-01 百科知识 版权反馈
【摘要】:它是一种将网上相关文本信息有机地编织在一起的信息组织方式。网络环境下,信息组织的对象逐渐多样化,除了传统的文献信息外,还包括大量的图形、图像、声音、视频信息,传统的文献分类法不可避免地受到挑战,与此同时也面临着新的发展机遇。分类法在网络信息组织中的作用主要包括如下4个方面。传统分类法用于网络信息组织和检索,使用最多的是DDC。

第二节 网络环境下的档案信息组织

一、信息网络环境下的信息组织方式

(一) 自由文本方式(Freetext)

主要用于全文数据库的组织,是对非结构化的文本信息进行组织和处理的一种方式。它不同于二次文献数据库的组织,无需前控,也不用规范化的语言对信息进行复杂的前处理,不是对档案特征的格式化描述,而是用自然语言深入揭示档案文献的知识单元,根据档案全文的自然状况直接设置检索点,能够完整地反映出一次文献的全貌,它是通过计算机自动进行档案信息处理和组织的。

(二) 超文本方式(Hypertext)

它是一种将网上相关文本信息有机地编织在一起的信息组织方式。它以节点为基本单位,节点间以链路相连,将文本信息组织为某种网状结构,使用户可以从任一节点开始,根据网络中信息的联系,从不同角度浏览和查询信息。这是一种非线性组织方式,能提供非顺序性的浏览功能,比传统的信息组织方式更加灵活方便,用户在查询过程中可以随时转换到自己感兴趣的信息,符合人们的联想思维方式。超文本方式与多媒体技术结合,称为超媒体方式(Hypermedia),它将文字、表格、声音、图形、图像等多媒体信息以超文本格式组织在一起,使人们可以通过高度连接的网状结构在各种信息库中进行浏览,找到多种媒体所载的各种信息。

(三) 主页方式(Homepage)

有点类似于档案全宗的组织方式。它将有关某一机构或某个人物的各种信息集中组织在一起,是对某个机构或人物的全面介绍,介绍的详略程度由建立主页的单位或个人自行决定。

(四) 联机编目方式(Online Cataloging)

入网的档案机构根据统一的规则和格式进行编目,各单位生成的书目数据通过网络进行实时传送和交换,形成一个逻辑上的书目库,实行书目数据的规范化、规模化生产。网上联机编目可以减少重复劳动,提高编目工作的效率和质量,实现档案目录信息资源的共享。

二、分类法在网络信息组织中的作用

分类的思想古已有之。分类是人类对文献信息和知识进行组织管理的古老方法,分类法在传统的手工检索环境中一直占有举足轻重的作用。网络环境下,信息组织的对象逐渐多样化,除了传统的文献信息外,还包括大量的图形、图像、声音、视频信息,传统的文献分类法不可避免地受到挑战,与此同时也面临着新的发展机遇。分类法在网络信息组织中的作用主要包括如下4个方面。

(一) 用于联机浏览检索

分类法具有较强的系统性和族性检索功能,其分类体系便于人们浏览一个学科或一个专业范围的情报资料,逐步确定自己的检索范围,因此能适用于人们对网络信息浏览检索需要。张琪玉教授对分类浏览检索的优点作了如下形象而具体的描述:“分类体系结构具有‘物以类聚’、‘鸟瞰全貌’、‘触类旁通’的作用,可以把内容庞杂、种类繁多的网上资源有系统地组织在一起,用户能很方便和有效地系统掌握和利用一个学科或专业范围或主题领域的知识和信息,即使未掌握检索原理和技巧的用户,也能通过从大类到小类的细目的逐层深入,比较容易检索到与其检索目的具有针对性的网络信息资源;分类体系的‘透明度’较高,用户通过分类浏览常可‘发现’他所需要但并不知道该事物名称的信息,不像关键词检索必须首先确知所需信息相应事物(或主题)的名称,才能入手检索”。[1]在现有的联机公众查询目录(OPAC)中,已有很多系统增加了“浏览周围书架”的功能,对通过任何途径查到的条目,均可由此进入分类系统,扩大或缩小检索范围。

传统的文献分类法以文献内容的学科属性为主要分类标准,类目体系按严格的隶属关系层层展开,类目以线性方式排列,类目层级较多,标记制度繁琐。文献分类法的这些特征对于内容繁杂、结构多样的网络信息资源的分类存在一定的局限性。因此,分类法在用作联机浏览检索时,应充分利用新技术、新方法对它进行某种程度的改造,提高分类法描述网络信息的能力,使之更加符合对网络信息进行浏览检索的要求。对传统分类法进行改造的方法很多,包括:降低分类难度,简化标记制度;利用超文本技术对网络资源进行多维揭示,反映学科发展的多维构架和事物的多维属性,为用户提供多途径浏览;根据网络资源的类型和特征,调整分类表的类目级次,实行粗分类原则;提高分类法类目词语的现实性,增添终端用户检索时所用的自然语言词语,及时反映网络资源中出现的新主题:扩展同主题词表的联系,采用分面分析方法,突破传统的线性组织方式;建立强大的参照系统;加强标引深度;分类法的机读化和网络化;检索语言的分类主题一体化和自然语言化,等等。

传统分类法用于网络信息组织和检索,使用最多的是DDC。OCLC于1992开始启动Internet信息资源编目项目,它对Internet信息资源分类用的是DDC。早在1997年,Internet上就有17个使用或宣称使用DDC组织Internet资源的网络信息服务系统,而同时,使用UDC和LCC的网络信息服务系统各为5个。[2]DDC21版的编制及其在网络上的应用引人关注。DDC在结构和编制方面,吸收和利用了分面分类的理论,例如,它的辅助表和“类似区分”(Divide Like)处理能反映和表达许多延伸出来的复杂主题。

(二) 用于非文本信息的组织

叙词法用于文本信息的组织具有优势,这是因为,叙词法的语词能直接专指地表达文献的主题概念,适合于对结构化规范文本的内容特征进行直接描述。但如果用叙词来描述和揭示非文本信息,则存在困难,因为图形、图像、声音、视频等非结构化信息不像书目信息那样格式化和规范化,其内容特征难于用文字确切表达,其形式特征往往表现为一定的颜色、纹理或声频,难以用文字直接表达。而分类法的聚类功能以及代码化标识则使其在描述非文本信息时具有独特的优势。例如,我们可以对难以用主题词表达的非文本信息进行粗分类,将同类信息集中在一起,赋予分类标识,再结合其他特征进一步地细分。

(三) 用于超文本系统的管理

超文本系统将网上信息组织为某种网状结构,用户在查询过程中可随时转换到自己感兴趣的信息,但用户在网络漫游过程中经常会出现“迷航”问题,在漫无目的的泛泛查询中迷失了浏览的方向和目的,浪费了宝贵的时间。这需要采取一定的指引和控制措施,引导用户的浏览,提示和帮助用户厘清自己的思路。分类法由于能直接反映概念之间的相互关系使其在超文本系统的管理中有自己的用武之地。

分类法的语义关系网络与超文本系统有某种相似之处,将它用于超文本系统,可以起到指南的作用。利用分类法的语义关系网,可对用户的检索过程和检索范围进行控制,为不同专业知识水平的用户提供查询信息的捷径。由于超文本系统提供的是非线性的浏览功能,因此,按线性排列的等级列举式分类法难以对超文本系统进行管理,必须对其进行改造才能使用,而分类主题一体化词表则是比较理想的选择。这是因为,分类主题一体化词表是将分类表和叙词表结合在一起的统一控制的检索语言,既保留了完整的等级分类体系,又通过参照系统反映了概念之间错综复杂的关系,能满足多种检索要求。分类主题一体化词表完善的关系网络可为超文本系统直接利用,用来设计和管理超文本的链路,并为具有不同检索要求的用户提供最经济有效的检索途径。

(四) 作为网络信息组织的通用工具

主题法系统由于受语种的限制难以实现国际通用性。而分类法系统在通用性方面有自己的优势:

(1) 分类法以号码作为标识,其等级体系反映了概念之间内在的逻辑关系,每个概念在这个分类体系中都有相对固定的位置,不会因为所用语种的不同而发生变化。

(2) 分类法的等级体系具有很大的伸缩性,一种分类表可供不同单位在不同类目等级上使用。

分类法的上述特性使其在现有的检索语言中最有可能成为国际通用的语言,成为网络信息组织的通用工具。国际上几部著名的分类法如DDC、UDC、LCC等都在谋求在网络上的应用,并已经取得相当的进展。DDC在网络信息组织方面的应用最为突出,不少网络信息服务系统和图书馆都在用DDC组织和查询Web资源。

目前,用于联机检索的分类法大多为传统的大型体系分类法。分析其原因,主要有如下几个方面:

(1) 这些分类法历史悠久,应用广泛,直接将它们用于网络信息的组织,对现有的信息组织体系影响较小,容易被人们接受。

(2) 这些分类法几乎都是综合性分类法,其类目范围覆盖各个学科专业领域,具有通用性。

(3) 体系分类法结构严谨,系统性强,其严密的等级体系直接反映了知识分类的成果,更适用于联机浏览检索的需要。

(4) 这些分类法大多已经有了机读版。如DDC的机读版Electronic Dewey于1993年出版,1994年修订,1996年将同年出版的DDC第21版制成用于视窗环境下的机读版发行,即Dewey for Windows。UDC的机读版也于1994年出版,并发行了光盘。1995年美国国会图书馆运用研制成功的USMARC将LCC的全部类目转换成了机读形式。分类法的计算机化为它们在网络中的应用创造了条件。

(五)促进分类主题一体化

分类主题一体化至今已经有了很大进展,越来越多的分类主题一体化词表编制出版,但其出版周期较长,推广使用的时间也很长。在联机检索系统中,分类主题一体化检索则较容易实现。例如,美国国会图书馆制订了一个有关分类数据的机读目录标准格式,在这一著录格式中,LCC的分类号与美国国会图书馆主题词表(LCSH)的主题词和人名记录相对应,有助于编目人员确定合适的主题词和分类号。此外,在机读版的DDC记录中,包含了与DDC类号相对应的LCSH的主题词,在其电子版的相关索引中还直接选用了LCSH的主题词。这些做法对分类主题一体化都起到了有力的推动作用。

通过对分类法在信息网络中的应用领域、应用现状及前景的分析,我们可以描述用于网络的分类法应具有的特征:

(1) 机读化和网络化。不仅要实现传统分类法的计算机化,而且应建立基于Web的应用系统,方便用户登录、使用并添加必要的注释和评论。

(2) 国际通用性。分类法在网络上的应用会跨越国界,实现国际通用性。主要表现在:作为网络信息组织工具的分类法几乎都能支持多语种检索;具有更少的政治和宗教倾向,如DDC21版就对DDC20的宗教类作了较大的修订,旨在降低其基督教倾向。

(3) 兼容性。这主要体现在各种分类法之间的兼容互换及其与主题法的兼容上。

(4) 灵活性。传统分类法具有相当的稳定性,修订周期长,而且一般不从根本上改动其结构体系,这使许多新学科、新事物、新概念不能及时在分类法中反映。用于网络信息组织和检索的分类法则具有很大的灵活性,可以方便地调整分类法的结构,随时增删改分类法的类目,并能根据网络信息组织和检索的需要作较大的改造。[3]

主题法在网络信息组织中的应用也十分广泛,具体应用为关键词法。关键词法是一种采用自然语言来组织信息的方法,关键词能深入、直观地揭示信息中所包含的知识,符合人们的思维习惯,因此关键词法在网络信息组织中得到了广泛应用。网上各种各样的搜索引擎和数据库大多采用了关键词法组织信息资源,如Google、Baidu等,中国科技期刊数据库、中国学术期刊光盘数据库也大多使用关键词法来组织信息。

三、网络信息分类体系

传统的文献分类法用作网络信息分类的改造之后,可适用于对网络学术信息资源的分类,但对网络上的大众信息资源进行分类却存在先天的局限性。目前,我国各大门户网站如新浪、搜狐、网易以及其他商业性网站采用的是网络信息分类法。最具有代表性的网络信息分类体系是Yahoo!的分类体系。

Yahoo!以人工编制的主题树方式,将信息按照主题分为如下14个基本大类:艺术与人文、商业与经济、电脑与因特网、教育、娱乐、政府、健康、新闻与媒体、休闲与运动、参考资料、区域、科学、社会科学、社会与文化。每一个基本类目下细分为不同层次的子类目,等级越低的子类目中的网站主题越专指、具体,从而建立起一个由类目、子类目等构成的可供浏览的相当详尽的目录等级体系。其类目设计基本合理,尽量囊括了互联网上丰富的信息种类,类目等级层次鲜明,各级类目的详略和宽泛程度不一,为网上信息资源的归类提供了一个基本的依据。许多网站以Yahoo!的分类体系为参照,建立了自己的分类体系,由于拥有的网站或信息的多寡以及所针对的用户群体的差异,不同网站的网络信息分类各不相同,但它们在本质上是相同的,即一种有别于文献分类法的针对大众信息资源的分类体系。它们具有如下特征:

(1) 类目设置从所能够提供的信息资源和普通用户的检索需要出发,突出日常所需,如教育、娱乐、保健、商业、新闻、休闲、体育等,通俗实用。但各网站的类目设置五花八门,分类标准不一,追求用户点击率和商业利益,类目体系所覆盖的知识领域缺乏完整性和严密性。

(2) 类目的排列(包括同位类的排列)缺乏逻辑性和规律性。

(3) 类名用词不规范,随意性大。

(4) 交替列类、多重列类,反映不同学科门类和知识之间的交叉、融合等横向关系。

为了强化网络信息分类体系的实用性、规范性和易用性,避免用户在面对不同网站所提供的不同分类体系时的茫然无措,可采取如下改进措施:

(1) 类目体系总体上采取主题分类模式,以类组的方式列举一级类目。如:金融/证券/股市/保险,文化/文学/艺术/娱乐/体育,等等。这样便于用户在主页界面中概览整个分类体系和类目内容。

(2) 可多重列类。其特点是在同一个类下,同时采用几个分类标准分别建立几个平行的子目系列,这几个系列之间内容是交叉的。

(3) 类目层级不宜过多或过少。过多会影响检索速度,过少则会影响浏览效果。

(4) 类名应简洁、确切、规范、通用,能准确概括网络信息资源的内容。

(5) 设专类揭示重要的网络信息资源或重要的数据库。

(6) 为了满足部分用户的专业检索需求,如果条件允许,可在普通分类体系之外添加专业分类体系。

(7) 保持分类体系的开放性和动态性,及时增加新的子类。跟踪热门类目,醒目标注。

综上所述,传统文献分类法在网络上的应用使其焕发了新的生机和活力,而网络信息分类体系与传统的文献分类法在分类对象、分类原理和分类方法等方面存在明显的差异,二者的性质不同,作用不同,不可相互替代,但可在细节和微观问题上相互借鉴。此外,目前的网络信息检索一般是分类浏览检索与关键词查询相结合,单一采用分类浏览或单一采用关键词法查询的网络信息服务系统较少。分类浏览便于对信息的层层剖析,适合兴趣浏览和阅读,用户在浏览过程中,所到之处有兴趣的就点击阅读,不感兴趣的就略过,但完全采用这种方式进行针对性强的情报检索就会比较拖沓繁琐,而关键词法具有直接性和专指性优点,便于特性检索,在进行情报检索时,与分类浏览功能互补。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈