首页 理论教育 年以来我国知识组织领域研究热点探析

年以来我国知识组织领域研究热点探析

时间:2022-03-04 理论教育 版权反馈
【摘要】:笔者通过查阅相关期刊论文数据库、有关出版物及相关网站,对2005年以来的国内知识组织研究热点进行深入总结与分析,将其归纳为10个专题,主要有:关于分类法、叙词表、本体、概念地图、简单知识组织系统SKOS、知识组织的互操作、数字图书馆的知识组织、学科信息门户的信息组织研究、TAG与Folksonomy、Web 2.0用于信息组织的研究。付桂华对《中国图书馆分类法》第4版中的地震学类目修订进行探讨。

2005年以来我国知识组织领域研究热点探析(1)

司 莉

(武汉大学信息管理学院)

【摘 要】通过查阅相关期刊论文数据库、有关出版物及相关网站,对2005年以来的国内知识组织研究热点进行深入总结与分析,将其归纳为10个专题,主要有:关于分类法、叙词表、本体、概念地图、简单知识组织系统SKOS、知识组织的互操作、数字图书馆的知识组织、学科信息门户的信息组织研究、TAG与Folksonomy、Web 2.0用于信息组织的研究。

【关键词】知识组织系统 分类法 叙词表 本体 研究热点

Research focus of Know ledge Organization since 2005 in China

Si Li

(School of Information Management,Wuhan University)

【Abstract】Through accessing related professional periodical ar-ticles database,some publications and websites,the research focus in the field of knowledge organization since 2005 in China is summarized and analyzed,it is concluded classification,thesauri,ontology,concept map,SKOS,interoperability,KOS of digital library,subject information gateway,TAG and Folksonomy,application ofWeb 2.0 in information organization.

【Keywords】knowledge organization system classification thesauri ontology research focus

知识组织的精髓在于对知识及知识间的关联进行揭示和组织,而实现知识结构的描述与组织,必须依赖于知识组织系统或体系。知识组织系统(KnowledgeOrganization Systems,KOS),是对人类知识结构进行表达和有组织地阐述的各种语义工具(Semantic tools)的统称,包括分类法、叙词表、语义网络、概念本体,以及其他情报检索语言与标引语言。知识组织系统自诞生以来就在知识的表达、标引与检索方面起着无可替代的作用,不仅用于传统信息的组织,而且在数字信息组织中的作用也是其他信息组织工具无法比拟的。

笔者通过查阅相关期刊论文数据库、有关出版物及相关网站,对2005年以来的国内知识组织研究热点进行深入总结与分析,将其归纳为10个专题,主要有:关于分类法、叙词表、本体、概念地图、简单知识组织系统SKOS、知识组织的互操作、数字图书馆的知识组织、学科信息门户的信息组织研究、TAG与Folksonomy、Web 2.0用于信息组织的研究。

1 关于分类法研究

1.1 关于《中图法》第4版的修订研究

《中国图书馆分类法》(以下简称《中图法》)第4版于1999年3月出版,2001年出版《中图法》电子版(视窗版、局域网版)。2001年《中图法》编委会启动《中国分类主题词表》的修订项目,2005年出版的《中国分类主题词表》第2版的《中图法》部分是《中图法》第4版维护的最新版本。《中图法》的修订是一项复杂的系统工程,涉及众多的理论技术问题和修订程序问题。

1.1.1 修订的整体构想

卜书庆与汪东波在分析《中图法》第4版存在问题的基础上,提出了《中图法》第4版修订的整体构想,包括修订思想、修订原则与修订的重点,提出了一般修订、局部修订与重点修订的3种方式,以及“针对性修订”和“系统性修订”两种修订方法(2)

孔晨妍与侯汉清提出借鉴国外分类法的优点和长处,着重探讨5种增补更新《中图法》的途径和方法(3),即来自《中国分类主题词表》和分类知识库、来自最新的电子文档和网页、来自文献数据库标引的关键词、来自概念空间、来自国外分类法的增补公报途径与方法。

马张华分析了DDC、LCC、UDC三大分类法在修订管理机制、修订方式上的特点,探讨了电子化、网络化对分类法修订的影响,提出《中图法》在修订与维护过程中应该进一步完善修订管理机制、确定合适的修订方式以及结合分类法的电子化应用进行调整(4)

宋剑祥提出《中图法》修改的趋势(5),主要有检索语言向“分类—主题”一体化的方向发展,分类标引向“体系—组配型”相结合的方向发展、版本向“纸质印刷—电子网络”版结合的方向发展、时间向“缩短周期—实时更新”方向发展、类表结构向“类目—类表”优化结合的方向发展、管理机制向“编辑小组—咨询委员会”结合的方向发展。

1.1.2 具体类目的修订

专家学者们对《中图法》第4版类目进行调研,提出一些修订建议。如蒋隽在对法学专家和图书馆学专家进行调研的基础上,分析了法学学科发展趋势及修订要求以及《中图法》第4版法律类存在的问题,提出了修改法律类的具体条目与修订的理由(6)

黄建年、侯汉清与何琳主要借鉴《UNESCO》分类表的做法,提出将G35全总类目并入G25下的对应类目或相关类目,这是图书情报学类目的修订改动最大之处(7)

付桂华对《中国图书馆分类法》第4版中的地震学类目修订进行探讨(8)。主要修订方法为:提高类目明细度,全面展现防震减灾事业和地震学科的最新进展;通过扩大外延,合理地将“震害防御”和“应急救援”类目纳入主表内;通过建立交替类目,解决学科交叉文献的归类。

薛春香与侯汉清提出了《中图法》第4版通用复分表的修订策略(9),主要有:扩大类目复分范围,增加类目组配自由度;增加通用复分表种类,增加揭示维度;改变标记方法,增加操作灵活性;多重列类,细化复分表;注重与其他分类法的兼容性。

1.2 国外分类法研究

对于国外分类法的研究主要集中在《杜威十进分类法》(DDC)与《国际十进分类法》(UDC)上。如马毓与邓小昭揭示了UDC自2000年到2005年的新进展(10),主要内容包括其当今的国际地位、主表与辅表的修订、计算机化与网络化等。

田书格以UDC(1985年英文版,1989年中文版)为基础,选取2006年11月更新后的网络版UDC以及《中图法》(第4版)、《人大法》(第6版)、《科图法》(第3版)4部分类法的通用复分表,从系统结构、使用规则、编制理论和技术功能等方面进行分析与比较(11)

曹树金探讨了DDC、UDC网络化的经验,提出要根据网络特点修订和丰富网络版内容,根据网络技术优化网络版的功能、完善《中图法》网站,增强用户的交互性等实现《中图法》网络化的建议(12)

王忠红详尽分析了WebDewey和电子版LCSH两者采用的组配技术(13)。杜慧平与侯汉清介绍了DDC第22版的修订机构、采用的修订方法与修订的主要内容(14)。侯雅楠介绍了DDC网站的内容,提出DDC网站具有:服务内容更新、速度更快,服务方式更加多样、服务手段更加先进、面向网络等特点(15)

1.3 分类法之间的互操作研究

分类法之间的映射主要解决不同分类法间的兼容与互换。这方面的研究集中在《中图法》与DDC之间的映射上。如戴剑波与侯汉清以《中图法》第4版(CLC4)和DDC为例分析了等级体系分类法相互映射的可行性、映射实现模式、自动映射的实现原理,并通过分析两部分类法类目之间的差异,认为类目之间应该存在四种语义映射关系(16)。采用空间向量模型解决匹配问题,把类目对应的词汇看成类目向量,多条DDC21类目向量就可以构成待映射的类目向量集合,映射类目(CLC4类目)看成是映射向量,根据各种映射关系的阈值范围,便可以建立CLC4类目与多条DDC21类目之间的映射关系。他们还以《中国图书馆分类法》与《杜威十进分类法》为例,探讨不同文献分类法自动映射系统的构建(17)。在DDC与CLC自动映射系统中,类目表达的概念可以分解成类名词、注释词、下位词、上位词,根据相似值最大原则对概念因素进行配对,通过配对概念的加权,实现类目之间相似度的自动计算。

1.4 中文自动分类研究

自动分类研究始于20世纪50年代,一直是情报检索语言领域的研究热点。文本自动分类是指文本和预先定义类之间的类属关系,分类工作由计算机自动完成。文本自动分类分为3个过程:首先对文本进行预处理,将文本数字化;接着构造并训练分类器;最后用分类器对新文本进行分类。文本分类一般分为训练和分类两个阶段,训练方法和分类算法是分类系统的核心部分。这方面的研究主题主要涉及自动分类方法、文本自动分类、中文网页自动分类方面。

1.4.1 自动分类方法研究

(1)基于分类法与词表的自动标引研究

高原与王保栋探讨了基于《中图法》的图书文献分类系统的设计与实现(18)。以《中图法》类名、《中国分类主题词表》的主题词和从已有的标引经验中获得关键词作为词表的主干词汇,并辅以相关工具书及其他资料作为词汇的补充,作为分词元素集合,同时采用适量的非用词,建立非用词表;以中文文献资料的题名、内容提(摘)要和正文作为信息获取的对象。通过对原始数据的有效整理,找出分类号、关键词和主题词之间隐含的概念关系,形成分类类目与标引词串的对应款目,推出最佳匹配的分类号。

何琳、刘竟、侯汉清总结基于《中图法》知识库的多层自动分类项目的研究经验,分析训练数据、特征词选择、分类算法、类目体系和评估方法等因素对多层自动分类的影响(19)。所采用的分类方法是基于分类号、主题词和关键词三者之间兼容互换的原理,对《中图法》标引实例进行数据挖掘,采用基于人工标引经验和机器学习相结合的分类算法,利用图标引实例构建分类知识库(规则库),利用词串定类的方法,通过计算待分类文本的关键词串与分类知识库的相关度度量来为文本进行分类。分类过程是将待分类文本经过主题标引行程的标引词串与分类知识库中的规则进行最佳匹配的过程。

文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。侯汉清与薛春香提出通过对这些数据的加工整理,以《中图法》类目体系为主干,组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类的方法(20)。知识库以《中图法》为主干体系,包含若干个词表和词典,其中分类号——关键词(串)对应表为主分类知识库,即知识库的主体;抽词词典、停用词表、同义词表、义类词典是主题标引知识库;地名表、时代表、文献类型表等为辅助分类知识库;另外还有采用《中图法》知识库标引和检索的文献数据库。

傅亮提出了基于《军事信息资源分类法》标引经验的自动分类模式的构想,其模式分学习和分类两个阶段(21)。学习阶段是分类知识库的构建阶段,该阶段充分利用已有的人工标引经验成果,采用统计法对具有分类和主题双重人工标引的记录以及分类法中的分类主题对应关系进行挖掘,建立一套分类号——主题词(串)对应关系,即分类知识库;分类阶段将待分类文本标引词串与分类知识库中的词串进行相似度计算,由系统自动给出高于相似度阈值的分类号,实现自动分类,基于标引经验和机器学习相结合的多层自动分类。

(2)其他自动分类方法研究

薛春香、夏祖奇与侯汉清从原理、系统设计、知识库构建、分类算法、性能等方面对自动分类的两种模式——基于训练语料和基于人工标引经验进行介绍和比较(22),认为:基于训练语料的自动分类模式完全依靠机器学习从训练集中发现类目的特征,数学论证充分,易于维护,比较适合于面向行业和主题的粗分类,但是过分强调了机器学习的效能,忽略了人工智力劳动成果的利用,训练过程和分类过程运算量,算法复杂;而基于标引经验的自动分类模式利用简单的统计学方法从书目数据库中挖掘人工标引经验,适用于面向体系分类法的详细分类,分类算法简单,运算量小,但过分依赖经验,缺乏有说服力的数学证明。

邓茜与林红提出中文新闻信息自动分类的核心是采用提取内容文本的主题词进行分类,并对系统所使用的主题词权值表进行动态调整(23)。简要流程如下:①读取内容文本;②使用自动分词获取主题词;③查询主题词权值;④统计各类主题词权值;⑤根据规则计算和调整结果;⑥根据权值结果将文本分类;⑦对错误分类,以人工动态调整,并反馈给系统。

卢致杰与徐维军提出了一种基于多范畴属性约简和复合相似度计算的多范畴信息自动分类方法(24),该方法首先在分类中引入决策属性,然后计算各范畴的决策类和广义决策类,获得多范畴分类属性的约简集族,并依此集族分别计算多范畴信息系统分类对象的复合相似度,依据复合相似度的计算结果对分类对象进行排序和标引,实现自动分类。

胡清华、谢宗霞与于达仁提出采用可变精度粗糙集模型中的分类质量构造新的特征词权重计算公式(25)。相对于广泛使用的逆文本频率加权方法,该方法改进了文本样本在整个空间中的分布,使得类内距离减少,类间距离增大,在理论上将提高样本的可分性。还利用支持向量机和近邻两种分类器,验证了这种新的加权方法对分类效果确实有所提高。

白振田与侯汉清开发了基于向量空间的实用行业自动分类系统(26),对构建分类概念空间的思路、步骤及主要技术,包括权值确定、算法构思、正确性及效率评价、停用词典、分词词典的构建等相关问题进行讨论。

1.4.2 文本自动分类研究

文本自动分类是指在给定分类体系下,根据文本内容自动确定文本类别的过程。

谭金波、李艺与杨晓江从自动分类的实验方法、测试方法以及影响自动分类的重要因素等方面来探讨近几年来自动分类研究的主要进展(27)

白振田与侯汉清采用“抽词词典+未登录词补充”的模式来构造词典(28),主要研究内容是词典的约简算法,借鉴关键词轮排原理,结合相关统计模型,从正反两个方面对原始抽词词典进行压缩和优选,以达到降维和准确表达主题的目的。

张雪英全面、深入地论述了基于机器学习的文本自动分类所涉及的文本自动分类方法、文本表达、降维、用文本分类机器学习方法、阈值策略、类性能评价相关问题及解决方法,并提出了当前该领域面临的主要研究问题(29),主要是独立于语种的文本表达方法、标引词的语义处理、机器学习方法面临的挑战、训练集的维护、合理的性能评价指标、分类体系对分类方法性能的影响。

萧莉明、于宽与蔡珣设计了一个有效的基于贝叶斯分类器的中文期刊自动分类系统(30)。该系统以期刊的名称作为唯一的标引内容,并利用自动分词技术将期刊名称分成待分类的样本集,通过对图书馆的样本数据进行训练建立的分类库,使用贝叶斯分类器实现中文期刊的自动分类。

吕彦红对文本分类中常用特征选择算法的性能以及优缺点进行了分析,采取一种组合特征选择方法,设计并实现了一个基于朴素贝叶斯分类算法的文本自动分类系统(31)

孟杰介绍了一个基于构造性覆盖算法的中文文本分类系统CCTCS(32),重点阐述了文本预处理、特征选择、维数约简和构造性覆盖算法及其改进等技术的实现。利用中国科学院计算技术研究所提供的汉语词法分析系统ICTCLAS对中文文本进行汉语分词,对文本进行预处理,使用信息增益与主成分分析相结合的特征选择方法,使用人工神经网络作为分类器,特征词的权重组成原始特征向量,和神经网络输入层的神经元一一对应。在文本分类时,输入待分类文本的特征向量,通过已训练好的神经网络对文本进行分类,以确定文本的类别。

1.4.3 中文网页自动分类研究

中文网页自动分类在信息检索、网页文本自动摘要等方面的应用越来越广泛,已成为数据挖据研究领域的重点和难点问题。

袁晓曦分析中文Web文本的特点和提出中文Web文本自动分类的关键技术,实现了一种中文Web文本自动分类工具的总体设计及各功能模块(33)。基于机器学习的中文文本自动分类系统由3个主要功能模块组成:网络蜘蛛、Web文本预处理和Web文本自动分类器。分析了基于机器学习的特征选取方法和文本分类器中采用的贝叶斯文本分类算法及对该算法的改进。通过学习用户感兴趣的样本文本自动建立用于Web文本分类的特征词库,通过特征词条匹配自动实现Web文本的分类。

周瑛探讨了中文主题网页自动分类的中文分词技术、特征项选择方法、遗传算法降维和自动分类技术等关键技术,选取支持向量机方法,在特征项选择过程中降低特征向量维数方面,采用遗传算法,用支持向量机方法训练构造SVM多类分类器(34)

吴虎子提出了中文网页自动获取和自动分类处理模型(35)。其关键技术为:基于GoogleWebAPI的网页批量获取;对于获取的网页进行预处理,采用ICTCLAS中文分词系统对文本进行分词;采用TFIDF向量表示法,统计特征词的词频和其文本频数,计算其权重,将文本映射为特征空间中的一个特征向量;建立训练文本库,采用改进的KNN算法实现文本的自动类别识别。

冯静研究了网页分类的基本原理和工作流程(36),即网页预处理、文本表示、特征选取、自动分类和分类效果评价5个步骤,从样本分布的角度出发研究KNN算法的改进策略,提出一种新的代表样本集的生成策略,提出了一种利用网页分块提取相关链接,并对相关链接的锚文本加权的权重修正方法,提高了类别特征词的权重,设计并实现了一个基于向量空间模型的中文网页分类器。

侯婷和蓝国勇所设计开发的中文网页分类工具主要由网页抓取、中文分词、特征选取、Naive Bayes机器学习等模块构成(37)。网页抓取模块是用来提取网页文本、进行文本分类。中文分词是在词典的支持下将段落或句子切分成词条。特征选取是从词条中挑选出适合于具有分类价值的词作为识别特征分量。贝叶斯学习及分类是对准备好的训练样本文本进行机器学习,其分类器为Naive贝叶斯文本分类器。

郑文对目前中文网页自动分类的方法、技术以及性能测评标准进行调查分析,提出中文网页分类系统的模型(38)。主要由数据预处理部分、训练部分和分类部分组成。探讨关键技术以及分类系统性能的测评方法。将词语在文本中的位置与在分类中的重要程度作为权值的两个因素,引入到经典的TFIDF公式中,对系统中网页文本的权值计算方法进行改进,在分类方法上,将聚类技术与KNN分类算法相结合。

2 关于叙词表的研究

网络时代的叙词表仍然是一种图书情报领域信息组织/知识组织的重要基础工具,主要应用领域包括信息标引与检索、学科分类导航、机器翻译、语义网络、语料词库切词等方向,也会与标准数据协议、映射或互操作、用户可视化服务、主题图、向本体转化等多种重要信息技术直接相关(39)

2.1 网络叙词表的研究

网络叙词表在组成上与印刷本叙词表没有大的差异,但在其生成和实现方式上有很多不同点,而且它在入口界面、词汇控制和标识系统3个微观结构方面也有着显著的特征和优势。

曹树金与郭菁分析了网络叙词的种类,并探讨了其宏观与微观特征,提出了宏观结构与微观结构优化的方法(40)

陈红艳与司莉从词表的主题范围、语种、网站界面、应用四个方面,调查国外40个网络叙词表,认为其构建现状特征是学科主题内容、编制语种及使用对象呈扩大趋势;词表功能及应用空间得到了扩展。建议在词表构建中需从加强用户检索行为研究、规范叙词表网站设计、实现与搜索引擎的链接、支持并鼓励用户参与等方面进行改进与完善(41)

司莉与陈红艳在调查分析国外40个网络叙词表用户界面的基础上,从词表可用性、易用性及界面友好性的原则出发,探讨词表用户界面设计策略,主要包括创建丰富全面的首页界面、建立完备易用的检索功能、实现多途径浏览的辅助检索、完善网络服务项目以及合理布局界面结构(42)

司莉从查询方式、结果显示、帮助措施、具体应用等调查了43种叙词表,揭示其应用的类型、检索途径及学科范围与语种等特点(43)。将其归纳为两种类型:一是仅供选择词汇使用,独立于检索系统之外(17个,占39.5%);二是叙词表嵌入在检索系统之中,作为检索系统的一部分(26个,占60.4%)。并就词表的显示与操作、使用帮助、互操作、向多语种发展以及叙词表管理系统等方面提出优化对策。

2.2 叙词表编制研究

这方面的研究可分为三方面,一是叙词表编制标准研究;二是词表编制方法研究;三是词表编制软件研究。

2.2.1 词表编制标准研究

刘春燕、沈玉兰与刘华分析比较ISO 25964-1与ISO 2788、ISO 5964的技术内容。提出对我国叙词表编制标准的修订建议(44),包括将单语种和多语种国家标准合并;吸收相关标准的合理成分;建立可扩展的符号体系;增加网络版叙词表的相关技术内容;增加叙词表互操作的数据模型和交换格式等。

宿瑞芳、李晓雯与侯汉清比较国际标准ISO2788、中国标准GB13190—91以及美国标准NISOZ39.19—2005对词间关系控制的异同,提出了中国叙词表编制标准的改进建议(45)

刘华、曾建勋与沈玉兰在介绍国际上主要叙词表编制标准的最新修订情况的基础上,结合数字化网络化信息环境对叙词表编制标准的挑战,认为叙词表编制标准发展趋势有(46):标准化对象由叙词表向知识组织体系发展;标准内容的重心由词表编制转向互操作;规范分面理论的应用将成为标准的重要内容;规范信息技术的应用将成为标准的重要内容。

2.2.2 词表编制方法研究

按照自动化程度,叙词表有3种编制方式:手工编制叙词表、计算机辅助编制叙词表和自动构建叙词表。叙词表的编制是一项浩大的复杂工程,传统的编制方法无法适应网络信息资源组织与检索的需求,一些新词汇无法及时收录和补充。自动构建叙词表方法可大大减轻编表专家的智力负担,缩短编表时间。杜慧平与侯汉清以财税领域为例,采用模式识别、词聚类、同现分析等自然语言处理技术实现自动识别词间等同关系、等级关系和相关关系,从而构建财税领域叙词表(47)。有研究者用计算机自动识别等同、等级和相关关系等自动构建方法创建电子政务主题词表,其主要技术是基于N-gram方法的词汇收集和选择词间关系的自动识别(48)

常春从叙词表概念术语的选择以及词间关系的建立两方面探讨叙词表的编制问题(49),他认为可从论文关键词中筛选高频专业概念术语、从网络资源全文索引库中提取高频概念术语、最大限度地增加等同关系术语,提出基于知识链接提取词间关系,如通过术语共现提取词间关系、通过用户词汇组合检索日志提取词间关系、使用巨型网络数据库信息提取词间关系的方法。

2.2.3 词表编制软件研究

词表的编制软件有利于词表编制者更加方便高效地进行分类表的编制、修订与管理,从而推动了分类表机编化的进程。这方面研究集中在国外较为通行的叙词表编制软件的介绍上。如穆丽娜与侯汉清介绍词表编制软件MultiTes 2005 Pro(50)。然后利用此软件试编了一部小型的通信专业分类表,探讨了构建分类表的总体设计、编制步骤和技术要点。杨俊梅、刘俊与侯汉清介绍机编词表软件——MultiTes 2005 Pro,详述了该软件的主要功能、结构、界面和使用方法(51)

杜慧平对Term Tree2000、MultiTesPro2007和Web2Choir TCS-10三种国外较为常用的独立叙词表管理软件进行对比和分析(52),考察国外叙词表管理软件实现数据导入和输出、对词的处理和控制、对词间关系的处理和控制、叙词表查询与显示等功能的相关指标配置。从实现信息组织和情报检索功能的角度出发,考察目前计算机辅助编制叙词表的技术水平。

2.3 《中国分类主题词表》研究

这方面的研究集中在对《中国分类主题词表》版本研究、电子版介绍与网络版的出版方面。侯汉清与李华从规模和性能上对《中国分类主题词表》新旧两个版本进行测评和比较(53)。主要从类目对应标引深度、词汇先组度、等同率、关联比和参照度4个指标对两者的性能进行比较,指出其不足是:类目对应标引深度较低,不能满足自动分类的需要;词表修订周期过长,词汇更新滞后;词表的性能和功能有待完善;印刷版版面设计有待改进。陈树年与刘惠敏对《中国分类主题词表》在传统图书馆、数字图书馆、虚拟图书馆、网络信息组织、学科门户和语义网中的应用进行了探讨(54)

卜书庆与贺玲勇介绍了《中国分类主题词表》电子版研制原理,认为电子版与印刷版相比,功能设计有10大特点(55):具有个性化用表环境的设计;具有多表、多文档互动结构的设计;具有参照项的超文本链接功能的设计;具有多途径、多方式的检索窗体的设计;具有结构化全文检索功能的设计;分类主题一体化扩检功能的设计;具有分类树视图存取功能的设计;具有词族表动态重组功能的设计;具有与计算机检索和标引应用系统的挂接功能的设计;具有添加评注、批注等公务目录作用的设计。

《中图法》Web版和《中国分类主题词表》(《中分表》)Web版已于2010年3月17日通过国家图书馆验收,在国际互联网上正式发布。具体提供如下服务和功能(56):①提供各类知识内容、主题词的在线浏览、互动显示和多途径检索服务。②为广大读者和参考咨询人员提供文献检索服务,可与多个Web OPAC(联机公共检索目录)连接,提供文献信息内容的多库实时检索和学科导航服务。③为分类标引用户提供利用分类号和主题词标引发送服务,把所需分类号或主题词粘贴到剪贴板供标引系统使用。④为广大读者等各类用户提供评论注释服务,针对知识款目或主题词或类目从任何角度添加评注,方便用户建立个人书签以及我们快速掌握读者及用户使用信息,提高CCT质量,更好地开展知识服务。⑤为图书馆业界提供CCT第2版和数据实时更新服务;利用其网络更新系统、检索词统计系统和评注系统可实时更新CCT的数据,缩短CCT维护修订周期,在CCT第2版基础上Web版已增补7000多条学科主题、个人名称、地理名称、机构名称等概念款目,并更新所有数据的关系系统。⑥为《中国分类主题词表》Web版修订和维护提供用户检索词的频率统计功能,以便系统增删改主题词或类目。⑦其他特殊服务等。

3 关于本体的研究

这方面的研究主要涉及本体构建的方法、本体构建的原则与程序、本体构建工具、本体的应用研究与领域本体的构建实践成果等方面。

3.1 本体构建的方法

本体创建是本体知识获取的核心,即从某个领域中抽取知识,形成描述该领域数据的语义概念、实例和其间的关系。目前创建本体的方法主要有:

3.1.1 基于叙词表的领域本体构建

领域本体是指以一个特定的领域为描述对象的本体,提供该特定领域的概念定义和概念之间的关系、主要理论和基本原理、领域中发生的活动等。

基于叙词表的本体构建的核心思想是:把叙词转换成领域本体中的概念;根据叙词间的层次关系,确定所对应的领域本体中概念间的等级关系;参考叙词的限义词、注释为领域本体中的概念添加属性;参照叙词间的关系为领域本体中的概念添加关系为领域本体中的概念添加实例(57)。迄今已有10多种叙词表被转换为Ontology。如联合国粮农组织(FAO)成立了农业本体论服务项目小组(AOS)将Agrovoc叙词表转换为农业本体,阿姆斯特丹大学的W ielinga等将艺术和建筑叙词表(AAT)转换为Ontology等。

国内学者在对叙词表与本体进行比较研究的基础上,主要探讨利用叙词表创建领域本体。王素芳介绍了由叙词表向ontology转换发展的3种方法(58):用RDFs关系表示叙词关系来建立ontology;用RDFs关系表示叙词内容的方法建立ontology;用daml+oil关系表示叙词关系的方法建立ontology,并对转换原则和转换过程中存在的问题与建议的进行探讨。

唐爱民、真溱与樊静提出了一种基于叙词表的领域本体构建方法(59),并通过基于《国防科学技术叙词表》构建军用飞机领域本体原型的过程对该方法进行了详细阐述。本体的描述语言选择RDF,构建的军用飞机领域本体原型包含:22个一级概念,共4级84个概念,34个属性,24个概念间关系,14个实例。

牟冬梅与崔艳玲提出利用《医学主题词表》(MeSH)构建医学领域本体(60),本体中的术语主要采用MeSH词表中的规范语言,并结合还未规范到MeSH词表中的自然语言,构筑医学领域本体的词表,参考MeSH表的参照关系、组配关系和入口词与主题词关系、主题词与副主题词关系,构筑医学领域本体的词义,发挥ontology表达复杂关系的优势,建立一个网状的医学领域主题图。

曾新红提出了用OWL(Web Ontology Language)表示方法,从概念模式的确立、类和属性的确立、复合主题中语义的深层揭示三个方面探讨将《中国分类主题词表》转换为本体的具体方案(61)

另外,还有研究者采用文献计量方法对《中国农业科技文献数据库》中的分类和主题标引进行分析,揭示主题词与类目之间的关系,用于构建农业初级本体(62)

3.1.2 基于SKOS的叙词表到本体的转换

2005年W3C推荐Simple Knowledge Organization System(63)(SKOS,简单知识组织系统),SKOS是资源描述框架语言RDF(S)的应用,为知识组织体系(包括叙词表、分类法、术语表等)提供一套简单、灵活、可扩展的机器可理解的描述和转化机制。SKOS是知识组织系统(例如叙词表、通用分类表、标题表和专业分类表等)的一个通用数据模型,其实质是一套词汇集,其中的词汇主要由RDFS词汇定义,SKOS是RDF面向概念框架表示这个特定领域的应用。或者说,SKOS是设计用来表达叙词表、分类法、系统分类法、标题表系统或任何其他种类结构化的受控词表的正式语言家族。SKOS建立在RDF及RDFS基础上,其主要目标是方便为语义网出版受控结构化词表。有研究者采用引入名称空间Namespace,构建本体类Class,构建本体属性Property,为类添加属性,为本体添加实例的步骤,选用英国档案词表(UKAT),利用本体的编辑工具Protégé应用SKOS标准构建了本体(64)

3.1.3 利用OWL构建本体

OWL(Web Ontology Language)是W3C开发的一种网络本体语言,用于对本体进行语义描述,继承了RDF的基本事实陈述方式以及RDFs的类和属性分层结构,在此基础上进行扩展,加入了许多新词汇,具有丰富的语义和关系逻辑表示功能。根据其表示和推理能力的大小将它分为3个递增的子类OWL Lite、OWL DL和OWL Full(65)。OWL本体包括了类、属性、个体的描述,其中类分为6种:简单类、枚举类、属性约束类、交集类、并集类、补集类,公理有4条:类存在(owl:Classrdf:ID="")、子关系公理(rdf:subclass of)、等价关系公理(owl:equivalentclass)、互斥关系公理(owl:disjointWith)。OW L属性:对象属性(owl:Object-Property)与数据类型属性(owl:DatatypeProperty)。对象属性是将主体所属类(domain,定义域)的个体和客体所属类(range,值域)的个体联系起来。

3.2 关于本体构建的原则与程序研究

实用而准确的本体创建原则与步骤,是创建高质量本体的关键要素之一。

李景,孟连生提出的本体构建的原则是:①知识本体的构建要面向特定的应用目的;②知识本体的构建应该基于一定的专业领域、学科背景或研究课题;③知识本体中包含的概念数目应该尽可能最小化,尽可能将冗余去除;④知识本体的规模应该是有限增长的;⑤知识本体中的“类”的设计应当秉承独立性原则;⑥类的设计还应当秉承共享性原则(66)。笔者将其原则总结为:应用性、专业性、共享性、及概念最小化等。

在本体构建过程中,研究者们提出了适用各自不同领域本体构建方法,如TOEV(Toronto Virtual Enterprise)、METHONTOLOGY、骨架法等。有研究者提出了构建领域本体的知识工程法包括5个步骤(67):①确定本体的领域与范围;②列举领域中重要的术语、概念;③建立本体框架;④设计元本体,重用已有的本体,定义领域中概念及概念之间的关系;⑤对领域本体编码、形式化,选用合适的本体描述语言对上述建立的领域本体进行编码、形式化。杜小勇与马文峰提出领域知识本体构建的基本过程(68),包括本体需求分析、本体构建规划、本体信息获取、本体概念及关系确定、本体形式化编码、本体的评价、本体的进化和本体的表示,并对其中的基本流程、内容与方法进行梳理和分析,强调了本体的进化、本体的构建是一个不断完善的、螺旋上升的、有序而系统的发展过程,进化是本体的生命所在。

3.3 关于本体构建工具的研究

本体构建工具,又称本体编辑工具,主要指用于本体的构建、编辑、维护与开发的软件系统。随着研究的逐渐深入,学者们从对本体编辑工具的简单介绍,深入到探讨不同编辑工具的评价与比较上。

陶皖与廖述梅介绍了OilEd、Protégé和WebOnto3种本体构建工具(69),并从结构、输入/输出语言、存储形式、可扩展性、本体库、推理能力对其进行比较。

徐国虎与许芳介绍Ontolingua Server、Ontosaurus、WebOnto、Protégé-2000、OntoEdit、Web0DE、OILED、DUET8种本体构建工具,提出一个包括可用性、软件结构、文件格式、知识表达能力、推理机制5个方面19个二级指标的评价框架(70),并运用该评价框架对上述8种工具进行比较。

李景对5种主要的本体构建工具Ontolingua、Ontosaurus、WebOnto、Protégé-2000、OntoEdit进行了详细介绍(71),认为各种工具都存在如下问题:①当前的本体构建工具一般不会为用户提供通用的概念/类的体系;②每种工具都各有不同的本体输入和输出格式,缺乏统一的Web标准;③绝大多数工具的插件都具有不同程度的对系统以及版本的依赖性;④不同种类工具构建的本体无法相互兼容,并且在异构系统中无法被复用;⑤构建工具的使用与基于本体的专家系统、检索系统以及机器翻译系统的改造换代脱节,使得本体的应用与构建脱节,导致生成的本体缺乏“生命力”。指出这些问题要真正得以解决有待于出现一种标准化的工具。

孙瑾从开发软件、编辑语言、关系表示形式、本体构建方式、功能设置等方面对OntoEdit、Ontolingua、Ontosaurus、WebOnto、OilEd、Protégé-2000 6种较成熟的本体编辑工具进行介绍,并从输入语言、输出语言、可扩展性、本体库、推理功能、源码、多重继承、一致性检验等方面进行对比(72),分析了Protégé-2000编辑工具的优势。

可见,国内研究者主要选取OilEd、Protégé、WebOnto、Ontolingua、Ontosaurus、OntoEdit等较为成熟的编辑工具进行比较。我们认为可从推理机制、描述语言、输入/输出格式、互操作、易用性、更新与维护、普及度(或影响力)等主要指标上对本体编辑工具进行评价。

3.4 关于本体应用的研究

3.4.1 本体在数字图书馆中的应用

本体可用于数字图书馆的信息组织、信息检索及异构系统间的互操作,并实现知识挖掘,从而使数字图书馆真正成为人们学习的知识空间。数字图书馆是本体应用的重要领域,已成为国内外业界关注的重要课题。

刘炜认为本体在数字图书馆中的作用为(73):①在人、机器(表现为软件代理)以及人与机器之间共享对于信息及其结构的共同理解;②实现一定程度的领域知识的重用;③本体可以明确领域假设,使领域公理得到明确描述从而达成共知;④对于领域知识进行分析、明确,并使其形式化;⑤提供与描述型元数据有关语义描述的知识地图;⑥提供资源库领域知识的规范描述;⑦提供元数据映射方案,集成到数字图书馆体系中的元数据服务中,成为协议的一部分;⑧提供智能代理与信息环境之间基于语义的理解机制;⑨跨平台、跨系统之间的通信中介;⑩分布环境下查询请求的语义理解;〇1数字图书馆中的数据挖掘。

杜文华提出本体在数字图书馆的作用主要有:提供与描述型元数据有关语义描述的知识地图;提供资源库领域知识的规范描述;提供智能代理与信息环境之间基于语义的理解机制;跨平台、跨系统之间的通信中介;分布环境下的语义检索;数字图书馆中的数据挖掘(74);

刘柏嵩提出了一种面向数字图书馆的本体自动构建方法(75),首先从因特网数据中找出本体语义概念的模式及其关系,然后通过构建概念分类体系来自动化地抽取数字图书馆的各类本体,包括以下步骤:术语选择、抽取本体概念、语义关系抽取、分类体系构建、本体构建和本体修剪及评价。设计的基于本体的数字图书馆框架主要由3个核心模块组成:搜索引擎模块,知识仓库模块和数字图书馆门户模块。

3.4.2 本体在信息检索中的应用

由于本体表达概念语义和推理的能力强,可用以消除自然语言理解中的歧义,并根据相关概念进行推理,挖掘隐含信息,对于网络信息组织与检索有较强的适用性。许多研究者对本体用于信息检索进行深入探讨。

有研究者探讨了将新型的知识组织工具Ontology引入并应用于检索系统的应用模式,提出传统应用模式、元搜索应用模式和互操作3种应用模式的设想(76)。传统应用模式是指将Ontology嵌入系统的检索处理基本流程中,都由Ontology来实施或完成;元搜索应用模式是指在用户接口部分引入一个Ontology,并分别建立Ontology与各成员引擎之间进行领域知识交换的转换器,实现基于元搜索应用模式的异构多信息源的检索处理;互操作应用模式指任意两个信息检索系统(IRS)之间都可以通过Ontology进行知识转换和互操作。

语义检索是从语义理解的角度分析信息对象与检索者的检索请求,是一种基于概念及其相关关系的检索匹配机制。刘肖静与耿骞提出要在用户提问检索式构造过程中增加语义制导,赋予检索式语义表达功能;制定严格规范的语法规则,规范检索结果的输出格式,便于检索结果的共享和重用;加强搜索引擎的推理功能,在完成对信息源搜索的基础之上,依据相关的背景信息实现基于概念的智能检索等方法,并运用Ontobroker概念代理引擎解决在网络上的信息资源检索问题(77)

丁晟春、岑咏华与顾德访探讨利用Protégé工具中内置的检索模块实现语义检索功能,使用Jena插件和JSP/Java语言开发基于Web的语义检索系统(78)。该模块允许:①构建检索表达式,并对类及其属性进行选择;②进行查询,并显示查询结果;③当检索表达式构建好之后,可以对其命名进行存储并显示;④在构建好Ontology实体,并对相关信息资源进行Ontology标注后,就可构建检索表达式。

毛平在前期研究成果—军用飞机领域本体构建的基础上,对基于领域本体的文本信息语义检索展开研究(79)。重点探讨了基于领域本体的文本信息标注方法,引入中文切词工具ICTCLA,提出基于通用词典与领域本体相结合的中文切词及词性标注方法与知识片段的提取思想,并从用户检索角度出发,研究了基于领域本体的用户查询语义扩展方法以及检索项推荐的实现算法,设计并开发了实验性的语义检索系统OIRS,实现基于语义的文本信息资源的检索功能。

基于本体的跨语言信息检索将本体作为中间语言来规范多语本体库中的概念,使源语言与目标语言内涵表达一致,并根据含义建立起多语映射,消除概念的语言表示与内涵之间的鸿沟。吴丹与王惠临分析了多语本体在查询扩展、语义标注、基于概念索引三方面对改善跨语言信息检索的作用,并通过介绍EuroWorldNet(EuroW orldNet主要是为了跨语言检索应用而建立的多语本体),探讨本体应用于跨语言信息检索的多语本体库的映射方法(80),认为采用中间语言作为概念表示,并通过词典翻译对照与不同语种的词汇建立链接关系是多语本体映射的一种良好方法。

3.4.3 分类法与词表的可视化

本体编辑工具可以通过各种形式表现类目,在Protégé的Jam-balaya插件中,有辐射形、喷泉形、垂直树形、水平树形等各种图形显示类目。欧阳宁与包平选择《中图法》中几个具有典型关系的类目,描述如何用Protégé进行构建,并通过Protégé的部分插件对这些类目及其类目间的关系进行图形化显示,以证明用本体工具Protégé实现《中图法》可视化的可行性(81)。欧阳宁与侯汉清选取《中图法》“J艺术大类”中“各种电影、电视”,按内容、题材和表现形式分为三大类,其类目层次严格按照《中图法》的体系结构,各类的类号作为本体名称一并输入。选择辐射形显示图,每个类用一黄色小方框表示,类目之间用蓝线相连,呈辐射状,图形充分显示了分类表的类目体系、类链和类列;而且每一个方框就是一节点,鼠标放置在方框上就会显示该类目的类名、下位类及注释(82)

欧阳宁还提出并设计了一种简单的可视化信息查询系统。首先利用本体编辑工具Protégé对《中图法》医药卫生学大类(总共2 307个类目)及总论复分表进行了构建,在定义中文类目结构的同时,还定义与中文分类相对应的英文分类。系统以OWL语言作为本体的描述语言实现了对本体的描述,以RDF/RDFS作为资源标记语言实现对数据的语义化标注,并利用Jena的持久性存储组件对本体文件进行存储,根据建立的本体关系模型,利用Jena的持久性存储组件对文件进行存储并采用OWL推理,通过运行自编的Java程序,设计出了简单的可视化信息查询系统,实现了《中图法》医药卫生学类目的可视化信息查询(83)

Protégé不仅能够图形显示和自定义词间关系,还可以用不同颜色代表不同属性,也可以对某个局部进行任意缩放,选择关系网状图显示的深度和复杂度等。刘俊等在分析本体编辑工具Protégé实现叙词表可视化的必要性基础上,以《汉语主题词表》为例,利用Protégé的可视化插件TGVizTab,进行叙词表等同关系、等级关系和相关关系的可视化实验,并讨论了整部关系和例举关系的可视化(84)

3.5 领域本体的构建实践成果

领域本体是指以某一领域为描述对象的本体。它们在一个特定的领域中可重用,提供该领域特定的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本原理等。李景以花卉学本体建模为例,探讨了本体理论及在农业文献检索系统中的应用研究(85)。有研究者以张謇研究本体知识库系统开发为例,对基于本体的专题域知识库系统的设计与实现技术进行探讨(86)。还有研究者选取较有代表性的《三国志》为例,通过历史年代本体建立的语义关联来聚集相关历史年代知识元,达到聚集同一或相关史实的目的(87)。有研究者采用W3C推荐的本体描述语言OWL作为编码语言,使用斯坦福大学开发的本体构建工具Protégé3.3.1编写领域本体文件,构建化学电源文献领域本体(88)

目前已成功开发的基于本体的数字图书馆——基于本体的国共两党关系历史数字图书馆,由董慧主持的研究小组创建而成。董慧等讨论了以历史事件为研究领域的本体数字图书馆检索模型GGHZ-DL(国共两党关系历史数字图书馆)的设计、构建和实现(89)。目的是开发实现本体基本功能(本体建库、本体检索、本体推理、本体可视化)的跨领域的本体平台,并确定以Java环境下的Eclipse平台作为系统实现的基础,使用本体编辑工具ProtégéOWL-plugin 3.0版、分词工具ICTCLAS(中科院计算所汉语词法分析系统)、语义解析工具Jena、语义索引工具Lucene、可视化插件TouehGraph等工具。还对语义信息提取的定义、原理和思路进行讨论,并以国共两党关系历史为领域背景,详细分析语义信息提取的过程(90)。介绍了选用OWL本体描述语言,以ProtégéOWL-plugin为编辑工具,创建“国共合作”领域本体构建(91)

4 关于概念地图的研究

概念图(ConceptMap)是康乃尔大学的诺瓦克(J.D.Novak)提出的,它是一种用节点代表概念、连线表示概念间关系的图示法。诺瓦克认为概念图是用来组织和表征知识的工具。它通常将某一主题的有关概念置于圆圈或方框之中,然后用连线将相关的概念和命题连接,连线上标明两个概念之间的意义关系。其构建过程为构图者根据其认知结构,命名节点、设置节点的位置、连接相关节点的过程。

4.1 概念地图的分析与评价研究

概念地图的结构分析方法作为知识评价工具具有合理性。马费成与郝金星提出了18个概念地图结构分析的测量指标,并验证了指标的信度和效度(92)。他们还认为概念地图构建方法、分析方法、分析指标的信度和效度三者密不可分,并以此为基础提出了概念地图作为知识评价工具的研究框架(93)

4.2 概念地图的应用

诺瓦克认为:任何组织,无论新老,都存在着组织成员间交流的问题。如果组织想要改进这一过程,概念图已经在各种各样的组织中显示出其有效性(94)

概念地图的研究领域主要涉及知识表示、知识提取和评价领域。马费成与郝金星对概念地图在知识管理领域的应用进行了专门探讨,认为概念地图作为知识表示的工具,可以提高对概念的理解;概念地图作为高级思维的认知工具,可以进行思维引导。概念地图作为知识提取的工具,可以提供交流共享。概念地图作为定量测评的工具,可以用于知识评价(95)

概念图的构建过程既是知识创新的过程,也是学习的过程。可将学习中涉及的资源链接到概念图,利用概念图导航检索所需知识。张会平、周宁与陈勇跃通过介绍GetSmart系统,探讨利用概念图沉淀隐性知识的方法,通过阐述概念导航工具CNT,分析利用概念图聚合显性知识的方法(96)

概念地图是指对特定主题建构的知识结构的一种视觉化表征。换言之,它是对概念及概念间关系的可视化表示方法,是人们将某一领域内的知识元素按其内在关联建立起来的一种可视化语义网络(97)。它以可视化的形式阐明了在知识领域内各个概念之间的关联。其最大的优点在于:对知识体系结构(概念及概念之间的关系)一目了然的表达,突出表现了知识体系的层次结构。另外,概念图还是很好的结构化知识评估工具。

瞿堃与雷菡对基于概念地图的路径控制机制以增强网络超媒体系统的适应性进行探讨,旨在减少浏览过程中信息超载和迷航(98)。将某个领域的知识、概念节点相互连接,构成概念地图,用户的浏览行为可映射到概念地图的某个概念节点或某段连接上,将用户的浏览历程和最优的路径相比较,然后通过适应性导航和适应性内容呈现对路径施加引导和控制。

4.3 概念图软件CmapTools研究

CmapTools是根据意义学习和建构主义的所有原则而专门设计开发的概念图软件。它可以通过概念上附属的图标访问任何形式的数字资源,使得建构能够真正成为“电子档案”的概念图成为可能。

张学福从CmapTools功能特点、知识模型、体系结构、同步合作等方面对CmapTools进行了介绍(99)。该软件具有采用图标表示知识模型内的链接简单和直观、低门槛和高性能、广泛支持知识模型的构建、支持广泛的合作与共享、采用灵活的组件体系结构、概念图的查找方便、手工建立概念图等特点。

孙玲以CmapTools为例,探讨基于概念图的知识模型的组织、发布、共享、协作、导出与导航机制,比较了传统的信息组织方式,认为概念图在知识组织功能上的优势是(100):简单直观、有利于知识结构的系统性及完整性、有利于知识的深层次揭示、便于大型领域知识的组织、方便用户导航、用户容易获取相关资源、有利于用户对领域知识的学习、界面友好、方便用户操作、响应速度快、容易扩展、方便知识及资源的管理和维护。

5 关于简单知识组织系统SKOS研究

SKOS是W3C在2005年制定的规范标准,主要用于支持使用诸如叙词表、分类法、标题表、以及术语表等各种知识组织系统,为其提供语义框架。张继东与尹群介绍了SKOS的语义描述机制(101)

刘丽斌等提出了将《中国分类主题词表》电子版自动转换为SKOS描述形式的构想(102)。利用Java语言编写内容提取程序,提取《中国分类主题词表》电子版中的主题词、词间语义关系、分类号、注释等,并分别存储在关系数据库中,通过SQL语言从数据库中提取相关字段,用Java语言写入SKOS描述的对应标签中,形成自动转换的SKOS描述代码。

刘春艳、曹锦丹与李佳军引入W3C推荐的知识组织体系SKOS作为叙词表转换的标准,对SKOS Core词表的常用标签进行介绍,并实际应用SKOS Core词表对EI叙词表中节选的段落进行转换表达,并用RDF图进行了显示(103)。刘春艳等还利用SKOS Core词汇表完成UKAT叙词表节选段落到本体的转换(104)。贾春枝以汉语主题词表为实例,对SKOS的内容与结构进行了描述,阐述SKOS用于叙词表的表达(105)

范炜选用ASIS出版的Thesaurus of Information Science and Librarianship(第2版)作为叙词表资源,抽取辅助范畴分类表(Fields and Disciplines)中的分面(Facet)的部分数据使用SKOS进行描述,并实现可视化(106)

6 关于知识组织的互操作研究

互操作就其本质而言,是对异质实体(包括异种体系结构、异种操作系统、异种网络和异种语言等)中可获得资源的透明调用的能力。实现互操作,就是要找到一种方法,使具有不同标识、结构、载体的分类表或主题词表的成分互相联系起来,用户只用一种检索语言或者不用任何检索语言(即直接使用自然语言)就可以实现联网环境下的跨数据库检索。

6.1 互操作模式与实现技术研究

侯汉清、刘华梅与郝嘉树将检索语言的互操作分为早期检索语言兼容性理论研究时期、分类主题一体化词表研制时期、基于计算机的检索语言互操作时期、知识组织系统互操作研究时期4个时期,较为全面地回顾了我国情报检索语言互操作的进展,包括主要项目及其特点,并对一些成功项目进行了分析和总结(107)

张金凤、张燕飞与陈玉顺对词素相似度识别转换模式、一体化语言系统模式、概念空间模型、学科事物概念组配模式和后控制模式等受控语言与自然语言一体化的五种模式进行比较,提出在词表内容上侧重建立专业性的系统,然后向综合性发展。在具体词表的设计中,认为目前UMLS模式比较理想(108)。司莉介绍国内外37项知识组织系统互操作计划,对以分类法为转换中心(中介词典)的兼容模式、基于MARC21权威数据格式的互操作模式、集成式的互操作模式的具体互操作实例进行分析,从在不同语言间的互操作、在中外分类法的兼容与互换方面、在领域本体集成化的互操作模式方面提出了实现我国知识组织系统的互操作的建议(109)

6.2 分类法间的兼容互换研究

实现分类法的兼容与互换,旨在使用户在一个系统中自由浏览其他分类法系统中的同一个概念的内容,用一个提问式就能获取多个相关数据库中的数据。

戴剑波与侯汉清以《中图法》和DDC为例分析了等级体系分类法相互映射的可行性、映射实现模式、自动映射的实现原理,认为类目之间应该存在4种语义映射关系。采用空间向量模型解决匹配问题,根据各种映射关系的阈值范围,建立CLC4类目与多条DDC21类目之间的映射关系(110)。并借鉴欧洲Renardus项目对类目映射关系的定义,以CLC第4版和DDC第21版的财政、金融、保险类为实验对象,建立自动映射系统(111)

张虹以《中文新闻信息分类》到《中图法》的转换为核心,分析不同分类法兼容互换的可行性与实现原理(112)。采用基于集成词表模式和对照索引模式的方法,实现《社会科学检索词表》、《中图法》和《中文新闻信息分类》之间分类法的结构转换。

6.3 叙词表间的互操作研究

刘华梅与侯汉清以教育类数据为例,选取《中国分类主题词表》、《教育主题词表》、《社会科学检索词表》等叙词表,具体介绍了基于词表结构的自动匹配和基于同义词表的语词匹配两种叙词表互操作技术的实现过程(113)。所提出的教育集成词库的方法是以《中分表》为核心,由若干词表构成的一个兼容体系。

6.4 学科信息门户间的互操作研究

学科信息门户互操作是指学科信息门户间交换和共享文档、查询和服务的能力。学科信息门户互操作的目标是向用户屏蔽分布的、异构的各个学科信息门户间的差别,实现对多个学科信息门户的交叉浏览和交叉检索,提供统一入口的多个学科信息门户的检索和浏览服务。张敏分别从网络协议、元数据格式、知识组织体系影响互操作的3种因素出发,分析实现互操作方法与技术,并将目前互操作的模式概括为链接模式和集成模式(114)

李育嫦以欧盟的Renardus项目为例,分析了分类法映射技术在学科信息门户交叉浏览中的应用(115),包括分类法映射的模式、通用分类法的选择、分类法类目映射关系的确立、分类对照表的生成、交叉浏览的显示结果等。

7 关于数字图书馆的知识组织研究

知识组织系统是数字图书馆的有机组成部分,一些较有影响的数字图书馆都非常重视知识组织系统的建设以及用户导航与检索界面的设计。馆藏、服务以及数字图书馆知识组织系统是数字图书馆的3个有机组成部分,需在数字图书馆环境中相互配合。所有的数字图书馆都有一个或多个知识组织系统,从而为浏览与检索馆藏内容提供支持。司莉等对27个数字图书馆的知识组织系统进行了调查(116),结果显示所有的数字图书馆均应用了知识组织系统,且主要采用分类法,特别是《中图法》(占44.5%)、自编分类体系(占51.9%),主题词表应用较少,仅占7.4%。

7.1 数字图书馆的知识组织系统构建策略研究

研究者们主要探讨了数字图书馆知识组织系统构建的内容、步骤与模式。如白海燕与姜波认为数字图书馆中的知识组织系统在构建和实现上应包括几个方面(117):知识组织系统的构建与管理、知识组织系统的互操作、语义元数据的生成及知识组织系统的存储与管理;并针对这4个组成部分,选取相关的开源软件,对每一结构在数字图书馆知识组织过程中的功能和作用进行说明。

张剑与宋文提出在数字图书馆中策划知识组织系统的步骤是(118):用户需求分析、知识组织系统的定位、体系结构的策划、维护以及向用户提供知识组织系统。

李桂贞与郑建明探讨了分类主题一体化模式、元数据、集成分类法、主题词表和语义元数据以及专家系统4种数字图书馆知识组织的策略(119)

吴雯娜对基于元数据、叙词表与主题图的数字图书馆的知识组织进行探讨(120),认为利用叙词表的知识体系作为概念检索和知识导航的基础,将元数据中的主题标识向叙词表映射,实现资源集合基于主题概念的汇聚和关联。利用XTM对该知识模型进行编码,并利用主题图可视化工具TMnav实现基于主题概念的资源导航。

7.2 数字图书馆知识组织的语义互联研究

向语义数字图书馆发展是数字图书馆的发展方向,语义网格通过语义Web技术与网格技术的结合,提供资源内容(信息)共享能力,即信息系统的语义互操作能力。使用语义网格技术可以为数字图书馆构建一个中间的环境(121),一方面能够形式化地描述知识,使其负载的语义能够为机器所解析和认识;另一方面使数字图书馆中的知识实现负载平衡与松散耦合,从而将知识、服务和用户有效地整合起来,这也是数字图书馆知识组织梦寐以求的目标。

语义网格技术应用于数字图书馆的知识组织中主要为解决资源的规范组织、语义互操作以及智能聚合的问题。韩毅提出解决这些问题的理论与技术基础是知识构建、数字图书馆互操作、语义Web和网格理论及技术,并指出构建本体知识地图是解决数字图书馆语义互联的一种易于实现的途径,分析探讨了本体知识地图的构建机制与应用框架(122)

语义互联的最终目标是屏蔽用户之间、用户与资源之间、用户与系统之间语义上的歧义,从而为用户提供一致的服务。主体、客体和环境等诸多因素直接或间接地影响语义互联的实现(123)。主体包括数字图书馆知识组织者和数字图书馆用户;客体主要是语义互联对象、语义模型、技术与标准;环境主要是宏观环境、中观环境和微观环境。

研究者探讨基于本体实现数字图书馆知识组织的语义关联,构建了以元数据、领域本体集、桥本体和本体解析体系为组成要素的数字图书馆的知识组织语义模型。其中,元数据用于资源规范化描述,领域本体集用于处理同领域概念之间的关系、桥本体用于处理领域本体之间概念及概念之间的关系,本体解析体系解决本体在系统中效用发挥的途径(124)。语义模型中本体解析体系为信息抽取为利用本体提供途径,牟冬梅、陈倩与王丽伟还提出了基于语义模型的信息抽取策略(125)

7.3 关于数字图书馆知识组织的发展趋势研究

知识网格是数字图书馆发展的新阶段。从用户可理解到机器可理解、从信息描述到知识表现、从语义隐含到语义揭示、从“以概念为中心”到“以概念——关系为中心”、从知识表示到智能推理是数字图书馆KOS变革与创新的发展方向(126)

毕强认为数字图书馆知识组织的发展趋势是从机器可读到机器可理解(127)。机器可读要求从电子化的知识组织系统向网络化的知识组织系统转向。机器可理解要从信息构建向知识构建转向,即知识组织系统的构建要从以概念为中心转向以概念—关系为中心。

网络知识组织系统是知识组织系统的发展方向,司莉与舒欣通过对历届国际数字图书馆联合会议(JCDL)和欧洲数字图书馆会议(ECDL)中的网络知识组织系统/服务(Networked KnowledgeOrganization System/Service,NKOS)分会的讨论主题进行总结与分析,指出国外网络知识组织系统(N KOS)研究呈现出语义化、协议化、互操作化的发展趋势,并且将从技术研究向用户和服务转移(128)。数字图书馆的知识组织系统也呈现出同样的发展趋势。

8 关于学科信息门户的其知识组织体系研究

学科信息门户是针对特定学科或主题领域,按照一定的资源选择和评价标准,规范的资源描述和组织体系,对具有一定学术价值的网络资源进行搜集、描述和组织,并提供浏览、检索、导航等增值服务的专门性信息门户。其知识组织体系设置是否科学合理直接关系到服务的绩效。

冯玉与雷菊霞在分析学科信息门户应用知识组织体系实例的基础上,提出学科信息门户中最科学的应用知识组织体系的方法是将上述的各组织体系整合在一个语义体系中(129),即将分类法和主题词表集成于语义网络中,用基于语义的元数据描述表达概念及其关系。

有研究者提出学科信息门户知识组织模式应该是用分类主题一体化的方式(130),它包括三个部分:①一个结构简明的知识分类体系,实现对信息知识领域的宏观控制;②一个智能化的控制词表,实现对作者语言与用户语言的控制和转换;③建立分类体系与控制词表的系统联系,将标引语言进而也将作者语言和用户语言纳入分类体系,实现自然语言检索。

王飞认为在采用图书分类法有关学科分类体系的基础上,结合学科研究的特性和用户信息查询习惯进行信息资源分类组织体系建设是较为适宜的知识组织体系建设方法(131),还应采用规范化的主题词表对学科信息门户采集的资源进行主题标引,以便提高信息检索准确度。

9 关于TAG与Folksonom y的研究

9.1 关于TAG的研究

大众标注是指使用标签(Tag)对自身创建或他人创建的网络信息资源进行标注,以供标注者自身或者他人检索信息资源的过程或结果。其结果表现为系统的标签云,Tag可用于网络书签、网络博客管理、非文本文件的管理。这方面的研究主要集中为对标签的基础理论与应用的研究,以及不同标签系统的比较研究等。

黄建年与侯汉清分析TAG处理对象、用户、同现率和后续处理方法的TAG的基础理论问题,并对TAG分类对纵向关系表达、赋予权、兼容性、多重列类以及发展趋向等的问题进行了探讨(132)。程慧荣、黄国彬与孙坦从标签的基本理念、标签的呈现界面、标签的组织对象、标签与信息检索、标签与信息检索、语义处理的研究、大众标注系统的标签发展趋势等方面揭示了国外基于大众标注系统的标签研究现状(133)

有研究者探讨了社会标注在图书馆网站、电子商务网站与社交性网站的应用(134)。翟爽与宋文提出社会标签在图书馆领域的应用可以分为两种模式:内嵌式服务模式,主要是指将社会标签直接引入到图书馆服务中;延伸式服务模式,指图书馆借助社会标签将服务辐射出去,形成更加有特色的服务模式(135)

李爱国对RefWorks、Connotea与CiteULike三种学术标签系统进行比较,提出学术图书馆要引导用户使用Connotea与CiteULike等社会性软件,以提高图书馆的服务能力与使用效力(136)。羌丽、张学莲与侯汉清对图书大众标注与主题标引进行比较,认为大众标注具有标注工序去复杂化、标注者不受限制、标注词不受控制、标注的自由度大、标注功能扩大等优点,但也存在标签数参差不齐、系统对标签的管理松散、系统缺乏对词形的控制等问题,并针对这些问题,提出相应的措施(137)

9.2 关于Folksonomy的研究

2004年Thomas Vander Val首次提出Folksonomy一词,“Folksonomy”是指“群众”自发性定义的平面型非层级结构式标签分类,使用者彼此之间分享分类的信息。目前有“分众分类法”、“通俗分类法”、“大众分类法”、“民众分类法”等不同的译名。据“因特网与美国生活项目”(Pew Internet and American Life Projects)2006年12月的调查结果,28%上网的美国人已经开始习惯采用标签方式组织自己的信息或利用网络上的共享信息。可见,社会分类法已经成为一种发展趋势。国内对这方面的研究始于2006年,自2006年以来发表关于Folksonomy的论文百余篇。研究的主题主要集中在以下几个方面:

9.2.1 Folksonomy含义与特点的研究

Folksonomy是一种全新的分类方式,与传统的学科分类法截然不同。众多研究者对其特征进行探讨。杨秀丹与苏娜探讨了Folksonomy的基本特征(138),包括:自下而上的分类方式、由用户定义频率来决定使用书签、标签分类公开共享、扁平结构体系、提供更多检索词和检索入口、直接反映用户词汇使用习惯、易于修订等。

王英通过对Folksonomy与传统分类法在创制人员、所属类别和位置、用户参与程度、本体和信息完整性上的比较,探讨Folksonomy的特点(139)。陈洁与司莉认为Folksonomy具有实时性、适应性、激励用户发现、非唯一性、多面性、群体效应、认知消耗少(140)。袁志秀以中文博客网站BlogBus为例对自由分类法进行实例研究,揭示中文自由分类法的语言特征(141)

Folksonomy不采用严格的分类标准,分类的形成过程完全是自发的,由用户直接提交。周荣庭与郑彬认为Folksonomy的主要机制基于“开放性元数据标准”和“自然语言社群聚类”(142)。采用的分类标签建立在DC元数据标准基础上,采用社群成员共同建立的标准来进行分类体系的建构。余金香认为Folksonomy具有平面化、非等级结构的类目结构、低成本的信息组织方式、多维度揭示信息资源等优势,并从Folksonomy存在价值、基于tag的定量分析、用户定量分析、系统设计与应用、缺陷解决措施以及检索等方面系统介绍国外Folksonomy的研究进展(143)

梁桂英、李记旭认为Folksonomy应该具有的含义是(144):由互联网普通用户共同创造(而非专业结构)、无严密的等级分类体系,词与词之间是平级或者相关关系、具有强大的知识聚合及共享功能、非常容易使用。其低成本、大众化、易用性使其更适合非主流的网络信息组织,反映的是草根文化和民间力量,传统分类语言适合主流的信息组织如图书馆、新闻出版等。Folksonomy并不能取代传统分类法和分面分类系统。Folksonomy最终是要采用受控手段并与受控语言相融和。

自由分类法的特点是自由、共享和动态更新。毛军以美味书签(de.l icio.us)、闪亮图片夹(flickr)和维基百科全书(wikipedia)为例讨论自由分类法的优缺点和应用模式(145)

隆捷分析了自由分类法产生的特定环境与实现信息组织、检索与共享等功能的运行机制等。以中文博客网站BlogBus为例进行了自由分类法的实例研究。认为标签的自由分类法具有以下特点(146):①以标签作为类目,亦即标注时使用的基本单元。②标签与标签之间是平等的关系,整个自由分类法是一种平面的结构,没有等级结构;标签之间也没有预先、明确地定义任何相关关系。③在平面化的自由分类法体系中,标签之间虽然没有上下位类的等级关系,但存在使用频率高与低、“热门”与“冷门”之分。④自由分类法中的标签总是动态变化的。

有研究者对Taxonomy、Folksonomy与Ontology三者的概念及其特性进行比较(147),认为Taxonomy是关于具体或抽象事物的分类组织的学科与方法,Folksonomy是大众自发的用标签对网络信息分类标识和共享的资源组织方法,Ontology是从语义和知识层次上描述构架信息系统的概念模型。

9.2.2 关于Folksonomy的应用的研究

随着Folksonomy在一些社会性网站中的成功应用,国外一些图书馆已经开始应用Folksonomy的实践。王梅总结了Folksonomy应用于图书馆的两种方式(148),第一种是图书馆直接加入具体的社会网络,这是目前图书馆利用社会性标签的主要方式;第二种是图书馆引入会性标签工具软件。并从信息组织与揭示和信息服务两个方面分析了Folksonomy在图书馆中的应用前景。

唐晓波、金莉莉利用社会网络分析的理论和方法,采用“浮出语义”(将语义视为一种自底向上逐步达成的协议,而无须事先给定的全局的语义模型)的思路,在将分众分类建模成由用户、资源和标签组成的三维网络的基础上,提出了通过对大量用户自由标注的网络标签的同现关系,挖掘出标签概念间的语义关联的思路(149),分析基于分众分类的“标引者—标签概念—实例”三部图模型发掘概念间语义信息、建立本体的方法和过程模型。

张燕萍参照分众分类的成功模式,提出了优化学科导航库建设的具体措施,包括建设理念要具有开放性,建立易于管理及用户参与的平台、制定交流模式、创造交流中信任与协作的氛围、提高学科导航库的知名度等(150)

Folksonomy聚类系统容易实现不同系统间的同一个标签内容的聚合,用户在对信息的分类方面有较大的自由度。

刘高勇与汪会玲提出了基于W iki与Folksonomy的专业信息生产与服务流程(151)

10 关于Web 2.0用于信息组织的研究

互联网已进入第二代互联网(Web 2.0)时代。Web 2.0的概念最早是2004年由美国学者DaleDougherty和Craig Cline在讨论因特网发展趋势会议上提出的,大多数学者认为Web 2.0是以Flickr、Craigslist、Linkedin、Tribes、Del.icio.us、43things.com等网站为代表,以B log、Tag、SNS、RSS、W iki等应用为核心,依据六度分隔、长尾理论、XML及A jax等新理论和技术实现的互联网新一代模式。其产生与发展给信息的组织、传播与利用模式带来巨大的变革。本文主要归纳Web 2.0在信息组织上的总体应用情况。这方面的研究主要涉及信息构建2.0、Web 2.0在图书馆应用的调查以及用户参与的图书馆信息组织模式研究等。

10.1 信息构建2.0研究

Web 2.0的出现使信息构建发展到了一个新阶段——信息构建2.0(IA2.0)阶段。在IA2.0阶段,IA作为一门学科、一种角色和一类社团的协调统一体而存在,强调真正“以用户为中心”和“丰富的用户体验”的核心理念,以满足新环境下的用户需求。马费成与刘记从Web 2.0环境所引起的用户需求的变化入手,分析传统信息构建原理的适应性及新环境下信息构建所具有的特点(152),提出了微信息构建、中信息构建、宏信息构建三个概念,在信息构建领域首次引入复杂性的有关理论与方法,如自组织理论、演化论、涌现理论、循环反馈理论等,并结合实例初步探讨了IA2.0阶段信息构建的形成原理和机制。

刘记等探讨了IA2.0的新视角、新理念与新内涵(153)。认为应按照Web环境的不同,对信息构建的发展阶段进行划分;IA2.0代表一个新兴学科、一种特定角色和一类人们相互交流IA的社团;网站IA2.0作为IA2.0的一个典型应用,应当设计符合IA2.0要求的网站,给用户提供丰富的体验;我国应加强基于Web 2.0的IA方面的研究。

信息构建2.0应以用户体验为评价依据,从用户使用网站的角度分析信息构建的质量。叶晓峰与刘记以“丰富的用户体验”为基本原则,分析并提出网站IA2.0的评估对象,即个人信息构建、信息构建1.0和社会信息构建。提出结合网站IA2.0的3个模型,采用定性和定量相结合的方法对Web 2.0网站的信息构建进行评估,并以博客站点为例进行实证分析(154)

李琛、刘记与高静通过对目前典型的Web 2.0网站的考察分析及其建站经验,探索了IA2.0设计的理论基础和基本原则,将网站建设与用户黏性的形成特性相结合,提出网站IA2.0的设计方案(155)

10.2 Web 2.0在图书馆应用的调查研究

肖荣荣等通过美国与我国关于Web 2.0应用的调查分析,得出当前用户对Web 2.0的了解和使用情况、Web 2.0网站面临的问题、Web 2.0用户的主要特征以及用户的网络行为变化等分析结果(156),认为用户对Web 2.0的认识程度低,认识渠道主要来自门户及专业信息网站,不了解Web 2.0的用户却是它的推动者,用户在信息交流中仍然处于被动状态,博客成为重要传播力量,RSS在一定程度上改变了用户阅读习惯,主流媒体是用户信息获取的主要来源,用户体验更看重方便易用,Web 2.0功能没有得到全面认识,用户面临技术门槛。

司莉与石若瑶选取30所“211工程”高校图书馆网站,调查RSS、W iki、Blog、Tag/Folksonomy、IM、Podcast/Vodcast、Toolbar、A jax等Web 2.0技术在图书馆的应用现状(157)。调查结果显示,有2/3的图书馆至少应用了1种Web 2.0技术,只有1/10的图书馆组合应用4种以上Web 2.0技术,应用最广泛的是RSS,最少的是W iki。Web 2.0在我国高校图书馆的应用还不够广泛深入,处于理念推广和应用探索阶段,其主要原因在于技术应用、馆员观念与素质、宣传营销和用户信息素养等方面存在不足。

司莉与谭仪选取我国所有省级及省会城市图书馆49所,对其采用Web 2.0技术的现状进行调查,涉及RSS、Blog、W iki、IM、Tag、A jax、Toolbar和SNS等在内的10项技术,并对各项技术及其应用情况进行了分析(158)。调查结果显示,我国省市级图书馆还处在Web 2.0应用的初级阶段,所调查的图书馆中,有超过一半的图书馆使用了Web 2.0技术为用户提供服务,主要涉及RSS、B log、IM、Tag技术,IM的应用最为广泛,W iki和Toolbar则有被应用,有近37%图书馆没有采用Web 2.0。

杨晓菲选取美国排名前100的高校图书馆和国内的包括985院校、211院校在内的187所高校图书馆作为调查对象,以RSS技术、W iki技术、Blog技术、SNS、IM等技术在中美高校图书馆的应用为调查内容进行网络调查(159)。Web 2.0技术在高校图书馆网站中得到了广泛应用,在所调查的美国前100所高校图书馆中已应用Web 2.0技术/服务的图书馆约占77.5%,国内所调查的187所高校中,已经借助Web 2.0技术构建图书馆服务的约占42.3%。高校图书馆目前应用的Web 2.0技术主要是RSS、Blog、W iki、IM及开源软件等。认为国内高校图书馆对SNS、IM工具的应用落后美国高校图书馆,中美高校图书馆对个性化服务工具的应用不够普及,中美高校图书馆2.0网站导航系统对Web 2.0元素标识不明确。

10.3 用户参与图书馆信息组织模式研究

吴江分析了豆瓣网与图书馆书目数据对接的意义,提出了改进豆瓣书目数据,实现与图书馆OPAC编目数据对接的方案(160)

陈新元基于调查问卷的分析介绍,针对不同的调查对象——图书馆馆员、高校学生以及图书情报教育师生,从理论与实际两方面入手,调查图书馆应用Web 2.0存在的障碍因素(161)。认为我国高校图书馆适应Web 2.0的客观障碍因素是Web 2.0整体发展不够稳定、经济发展不平衡限制Web 2.0的应用、高校图书馆管理方式不适应Web 2.0发展、知识产权问题与个人信息安全问题,主观障碍因素是馆员态度不积极、信息素养能力不强与主动编辑性不高等。

石若瑶分析了Web 1.0环境下网络信息组织模式的内涵、构成要素和方法体系,从信息资源、用户需求、支撑技术三方面指出Web 1.0信息组织模式在Web 2.0环境下存在的问题。从用户参与图书馆信息组织的需求、意愿以及形式等问题进行调查分析,并对Web 2.0技术在中美高校图书馆门户中的应用进行调查,将其作为构建模式的实践基础,提出了Web 2.0环境下用户参与高校图书馆门户信息组织模式主要特点是强调“用户参与”,将图书馆信息组织模式构成分为信息组织1.0、个人信息组织与社会信息组织三部分(162)

陈红艳分析了影响图书馆信息组织模式变革的因素与Web 2.0环境下图书馆信息组织的特征,从用户参与图书馆信息组织的需求、动机行为入手对用户参与图书馆信息组织的行为进行理论分析,调查分析了Web 2.0环境下用户参与图书馆信息组织的实践基础,提出了用户参与的信息组织模式的构成要素、功能分析与主要特征,并以用户参与的Tag-OPAC模式为例进行实证研究(163)

【作者简介】

img36

司莉,女,汉族,1965年3月出生,武汉大学信息管理学院教授,博士生导师。主要研究方向为:知识组织与知识管理、图书馆营销与公共关系。2005年2—8月,应邀以高级访问学者身份赴美国加州大学伯克利分校从事合作研究。主持教育部人文社会科学研究项目“面向知识创新的图书馆知识构建与服务研究”(08JA870012)、主持国家社会科学基金项目“Web 2.0环境下用户参与的图书馆信息组织模式研究”(09BTQ013)项目研究。出版与参编著作10余部,发表论文70余篇。

【注释】

(1)教育部人文社会科学研究项目“面向知识创新的图书馆知识构建与服务研究”(08JA870012)成果之一。

(2)卜书庆,汪东波.《中国图书馆分类法》(第4版)修订构想[J].国家图书馆学刊,2008(2):27-31.

(3)孔晨妍,侯汉清.《中国图书馆分类法》类目更新途径之探讨[J].图书馆工作与研究,2007(1):22-25.

(4)马张华.国外文献分类法修订维护的发展及对《中图法》的启示[J].国家图书馆学刊,2008(2):40-44.

(5)宋剑祥.从世界四大图书馆分类法看《中图法》的修改趋势[J].图书馆杂志,2010(4):16-19.

(6)蒋隽.《中图分类法》第4版法律类目修改调研报告——经济、民商及国际法类目[J].法律文献信息与研究,2008(1):43-54.

(7)黄建年,侯汉清,何琳.《中图法》图书馆学情报学大类修订构想[J].国家图书馆学刊,2008(2):32-35.

(8)付桂华.《中国图书馆分类法·地震学专业分类表》的编制修订[J].国际地震动态,2008(8):37-40.

(9)薛春香,侯汉清.面向数字环境的《中图法》通用复分表修订思考[J].中国图书馆学报,2009(6):61-65.

(10)马毓,邓小昭.世纪之初UDC的新进展[J].现代情报,2007(1):29-31.

(11)田书格.新版UDC与我国三大分类法的通用复分体系比较研究[J].山东图书馆季刊,2007(4):57-61.

(12)曹树金.DDC、UDC网络化对《中图法》发展的启示[J].国家图书馆学刊,2008(2):36-39,70.

(13)王忠红.WebDewey和电子版LCSH组配技术探微[J].图书馆杂志,2007(12):22-25.

(14)杜慧平,侯汉清.《杜威十进分类法》第22版的新进展[J].图书馆理论与实践,2005(1):95-96.

(15)侯雅楠.“DDC”的网络发展及其服务模式[J].国家图书馆学刊,2005(2):75-77.

(16)戴剑波,侯汉清.图书分类法映射系统设计原理—以《中国图书馆分类法》和《杜威十进分类法》为例[J].情报学报,2005(3):299-303.

(17)戴剑波,侯汉清.文献分类法自动映射系统的构建——以《中国图书馆分类法》与《杜威十进分类法》为例[J].情报学报,2006(5):594-599.

(18)高原,王保栋.基于《中图法》的图书文献分类系统的设计与实现[J].高校理科研究,2009(28):120-121.

(19)何琳,刘竟,侯汉清.基于《中图法》的多层自动分类影响因素分析[J].中国图书馆学报,2009(6):49-55.

(20)侯汉清,薛春香.用于中文信息自动分类的《中图法》知识库的构建[J].中国图书馆学报,2005(5):82-86.

(21)傅亮.《军事信息资源分类法》标引经验的自动分类模式构想[J].现代图书情报技术,2007(11):76-79.

(22)薛春香,夏祖奇,侯汉清.基于语料和基于标引经验的自动分类模式比较[J].南京农业大学学报:社会科学版,2005(4):85-92.

(23)邓茜,林红.中文新闻信息自动分类标引的构想与实现[J].中国传媒科技,2005(9):19-21.

(24)卢致杰,徐维军.多范畴信息系统的自动分类方法研究[J].情报学报,2005(1):53-58.

(25)胡清华,谢宗霞,于达仁.基于粗糙集加权的文本分类方法研究[J].情报学报,2005(1):59-63.

(26)白振田,侯汉清.基于向量空间的行业自动分类系统应用[J].情报科学,2005(6):940-944.

(27)谭金波,李艺,杨晓江.文本自动分类的测评研究进展[J].现代图书情报技术,2007(5):14,46-49.

(28)白振田,侯汉清.文本自动分类中抽词词典的约简算法研究[J].情报理论与实践,2007(5):678-680.

(29)张雪英.基于机器学习的文本自动分类研究进展[J].情报学报,2006(6):730-739.

(30)萧莉明,于宽,蔡珣.一种基于Bayes分类器的中文期刊自动分类系统[J].现代情报,2007(4):146-147,150.

(31)吕彦红.文本自动分类技术研究及实现[D].桂林:桂林理工大学硕士学位论文,2009.

(32)孟杰.基于构造性覆盖算法的中文文本分类[D].合肥:安徽大学硕士学位论文,2007.

(33)袁晓曦.基于机器学习的中文文本自动分类的研究和应用[D].武汉:武汉理工大学硕士学位论文,2007.

(34)周瑛.中文网页自动分类技术研究[D].桂林:桂林工学院硕士学位论文,2008.

(35)吴虎子.中文网页获取及自动分类技术研究[D].武汉:武汉理工大学硕士学位论文,2007.

(36)冯静.基于向量空间模型的中文网页自动分类技术研究[D].上海:中国石油大学(华东)硕士学位论文,2008.

(37)侯婷,蓝国勇.中文网页的自动分类[J].交通与计算机,2005(4):114-117.

(38)郑宁.基于Web数据挖掘技术的中文网页自动分类系统的研究[D].北京:北京师范大学硕士学位论文,2006.

(39)曾建勋,常春.网络时代叙词表的编制与应用[J].图书情报工作,2009(8):4-11,16.

(40)曹树金,郭菁.网络叙词表的组织结构及优化模式研究[J].图书情报工作,2005(3):31-35.

(41)陈红艳,司莉.网络叙词表构建的现状调查与分析[J].图书馆理论与实践,2008(5):33-36.

(42)司莉,陈红艳.网络叙词表用户界面设计策略[J].现代图书情报技术,2008(5):14-20.

(43)司莉.叙词表在网络信息组织中应用的调查分析及其优化[J].图书馆论坛,2007(6):105,183-186.

(44)刘春燕,沈玉兰,刘华.ISO25964的技术内容分析及对我国叙词表编制标准的修订启示[J].图书情报工作,2009(8):25-29,38.

(45)宿瑞芳,李晓雯,侯汉清.叙词表词间关系处理规则的比较研究——以国际、中国、美国标准为例[J].中国索引,2008(4):38-43.

(46)刘华,曾建勋,沈玉兰.网络环境下叙词表编制标准的国际发展趋势[J].情报杂志,2009(11):41-45.

(47)杜慧平,侯汉清.网络环境中汉语叙词表的自动构建研究[J].情报学报,2008(6):863-869.

(48)仲云云,侯汉清,杜慧平.电子政务主题词表的自动构建研究[J].中国图书馆学报,2008(3):97-102.

(49)常春.数字环境下叙词表的发展及应用展望[J].情报理论与实践,2009(12):48-50,67.

(50)穆丽娜,侯汉清.用机编词表软件构建专业分类表——以MultiTes2005Pro为例[J].情报科学,2007(12):1859-1864.

(51)杨俊梅,刘俊,侯汉清.简便易行的机编词表软件——MultiTes[J].中国索引,2007(3):51-56.

(52)杜慧平.国外计算机辅助编制叙词表软件评价[J].现代图书情报技术,2009(9):17-21.

(53)侯汉清,李华.《中国分类主题词表》(第2版)评介[J].国家图书馆学刊,2006(2):15-21.

(54)陈树年,刘惠敏.从网络信息组织看《中国分类主题词表》[J].国家图书馆学刊,2006(2):21-27.

(55)卜书庆,贺玲勇.《中国分类主题词表》电子版研制概述[J].国家图书馆学刊,2006(2):10-14.

(56)《中图法》编委会.《中国分类主题词表》Web版[EB/OL].[2010-05-25].http://cct.nlc.gov.cn.

(57)唐爱民,真溱,樊静.基于叙词表的领域本体构建研究[J].现代图书情报技术,2005(4):1-5.

(58)王素芳.Ontology与叙词表的融合初探[J].大学图书馆学报,2005(1):74-78.

(59)唐爱民,真溱,樊静.基于叙词表的领域本体构建研究[J].现代图书情报技术,2005(4):1-5.

(60)牟冬梅,崔艳玲.MeSH、本体论在医学知识组织中的作用[J].情报杂志,2005(7):120-122.

(61)曾新红.《中国分类主题词表》的OWL表示及其语义深层揭示研究[J].情报学报,2005(2):151-160.

(62)苏晓路等.农业科技信息智能检索系统中的知识组织[J].现代图书情报技术,2005(12):34-38.

(63)Simple Knowledge Organization System[EB/OL].[2010-03-16].http://www.w3.org/2004/02/skos/.

(64)刘春艳.语义Web环境下基于SKOS的叙词表到本体的转换研究[D].长春:吉林大学学位论文,2006.

(65)W3C.OWLWeb Ontology Language Overview[EB/OL].[2010-06-10].http://www.w3.org/TR/owl-features/.

(66)李景,孟连生.构建知识本体方法体系的比较研究[J].现代图书情报技术,2004(7):18-22.

(67)肖敏.领域本体的构建方法研究[J].情报杂志,2006(2):70-71,74.

(68)杜小勇,马文峰.学科领域知识本体建设方法研究[J].图书情报工作,2005(8):74-78.

(69)陶皖,廖述梅.当前本体编辑工具的分析与研究[J].计算机工程与设计,2005(3):761-763.

(70)徐国虎,许芳.本体构建工具的分析与比较[J].图书情报工作,2006(1):44-48.

(71)李景.主要本体构建工具比较研究(上、下)[J].情报理论与实践,2006(1):80,109-111;2006(2):222-226.

(72)孙瑾,本体编辑工具的分析与研究[J].图书情报工作,2006(12):26-29,97.

(73)刘炜.基于本体的数字图书馆语义互操作[D].上海:复旦大学信息学院博士学位论文,2006.

(74)杜文华.本体的构建及其在数字图书馆中的应用研究[D].武汉:武汉大学信息管理学院,2005.

(75)刘柏嵩.面向数字图书馆的本体自动构建[J].中国图书馆学报,2006(5):47-51.

(76)赵丹群,徐学文.面向信息检索的Ontology应用模式分析[J].数字图书馆论坛,2007(5):7-11.

(77)刘肖静,耿骞.Ontology与面向概念的网络信息检索[J].情报理论与实践,2004(6):568,638-641.

(78)丁晟春,岑咏华,顾德访.基于Ontology的语义检索研究[J].情报学报,2005(6):702-707.

(79)毛平.基于领域本体的文本信息语义检索研究[D].南京:南京理工大学硕士学位论文,2007.

(80)吴丹,王惠临.本体在跨语言信息检索中的应用机制研究[J].图书情报工作,2006(9):10-13.

(81)欧阳宁、包平.基于本体《中国图书馆分类法》的可视化实现[J].图书馆杂志,2008(1):28-32.

(82)欧阳宁、侯汉清.网络环境下文献分类法的可视化[J].中国索引,2007(2):34-40.

(83)欧阳宁.基于本体工具的《中图法》医药学类目的可视化研究[D].南京:南京农业大学硕士学位论文,2008.

(84)刘俊等.叙词表词间关系可视化实验研究[J].大学图书馆学报,2008(1):61-65.

(85)李景.本体理论及在农业文献检索系统中的应用研究—以花卉学本体建模为例[D].中国科学院文献情报中心博士论文,2004.

(86)钱智勇.基于本体的专题域知识库系统设计与实现——以张謇研究专题知识库系统实现为例[J].情报理论与实践,2006(4):476-479.

(87)肖怀志,李明杰.基于本体的历史年代知识元在古籍数字化中的应用—以《三国志》历史年代知识元的抽取、存储和表示为例[J].图书情报知识,2005(3):28-33.

(88)刘卓燕.化学化工文献本体的构建与实现研究[D].上海:上海交通大学硕士学位论文,2008.

(89)董慧,等.基于本体的数字图书馆检索模型研究(I)—体系结构解析[J].情报学报,2006(3):269-275.

(90)董慧,等.基于本体的数字图书馆检索模型研究(Ⅱ)—语义信息的提取[J].情报学报,2006(4):451-461.

(91)董慧,等.基于本体的数字图书馆检索模型研究(III)—历史领域资源本体构[J].情报学报,2006(5):564-574.

(92)马费成,郝金星.概念地图及其结构分析在知识评价中的应用(Ⅲ):实证研究[J].中国图书馆学报,2006(5):9-16,24.

(93)马费成,郝金星.概念地图在知识表示与知识评价中的应用——概念地图作为知识评价的工具及其研究框架[J].中国图书馆学报,2006(4): 22-27.

(94)希建华,赵国庆.“概念图”解读:背景、理论、实践及发展—访教育心理学国际著名专家约瑟夫·D·诺瓦克教授[J].开放教育研究,2006(1):4-8.

(95)马费成,郝金星.概念地图在知识表示和知识评价中的应用——概念地图的基本内涵[J].中国图书馆学报,2006(3):5-9,49.

(96)张会平,周宁,陈勇跃.概念图在知识组织中的应用研究[J].情报科学,2007(10):1570-1574.

(97)周宁,张芳芳,余肖生.可视化技术在知识管理领域的发展[J].图书情报工作,2006(11):68-71.

(98)瞿堃,雷菡.基于概念地图的适应性网络信息服务系统研究[J].图书情报工作,2007(1):72-73,85.

(99)张学福.基于概念图的知识模型组织及协作机制研究——以Cmap-Tools为例[J].现代图书情报技术,2005(11):34-38.

(100)孙玲.基于概念图的知识组织和检索研究[D].吉林:黑龙江大学信息管理学院硕士学位论文,2008.

(101)张继东,尹群.简单知识组织系统SKOS及其应用研究[J].现代情报,2008(11):20-21,25.

(102)刘丽斌,等.《中国分类主题词表》的SKOS描述自动转换研究[J].中国图书馆学报,2009(6):56-60.

(103)刘春艳,曹锦丹,李佳军.语义Web环境下知识组织体系SKOS应用研究[J].图书情报工作,2006(6):23-27.

(104)刘春艳,陈淑萍,伍玉成.基于SKOS的叙词表到本体的转换研究[J].现代图书情报技术,2007(5):32-35.

(105)贾春枝.简单知识组织系统与汉语主题词表[J].中国图书馆学报,2008(1):75-78,84.

(106)范炜.语义网环境中的叙词表实例研究——利用SKOS构造机器可理解的知识组织体系[J].情报科学,2006(7):1073-1077.

(107)侯汉清,刘华梅,郝嘉树.60年来情报检索语言及其互操作进展(1949-2009)[J].图书馆杂志,2009(12):2-13.

(108)张金凤,张燕飞,陈玉顺.受控语言与自然语言结合模式比较研究[J].图书情报知识,2005(4):75-77.

(109)司莉.知识组织系统的互操作及其实现[J].现代图书情报技术,2007(3):29-34.

(110)戴剑波,侯汉清.图书分类法映射系统设计原理——以《中国图书馆分类法》和《杜威十进分类法》为例[J].情报学报,2005(3):299-303.

(111)戴剑波,侯汉清.文献分类法自动映射系统的构建——以《中国图书馆分类法》与《杜威十进分类法》为例[J].情报学报,2006(5):595-599.

(112)张虹.基于集成词表和对照索引的文献分类法兼容互换研究-以国内三部分类法教育类为例[D].南京:南京农业大学硕士学位论文,2008.

(113)刘华梅,侯汉清.叙词表互操作技术研究——教育集成词库的试验[J].中国图书馆学报,2008(5):95-99.

(114)张敏.学科信息门户互操作的机制研究[D].武汉:华中师范大学硕士学位论文,2005.

(115)李育嫦.分类法映射在学科信息门户交叉浏览中的应用——以Renardus为例[J].图书馆学研究,2006(10):64-67,70.

(116)司莉,徐丽晓,陈红艳.知识组织系统在我国数字图书馆中的应用及界面研究[J].情报科学,2007(3):445-450.

(117)白海燕,姜波.基于开源软件构建数字图书馆的知识组织体系[J].现代图书情报技术,2009(4):7-13.

(118)张剑,宋文.数字图书馆的知识组织系统[J].图书馆理论与实践,2005(5):11-13.

(119)李桂贞,郑建明.论数字图书馆的知识组织[J].图书馆理论与实践,2007(5):70-73.

(120)吴雯娜.基于元数据、叙词表与主题图的数字图书馆知识组织[J].情报学报,2006(5):345-347.

(121)毕强,牟冬梅,刘昆.语义网格环境下数字图书馆知识组织研究[J].图书情报工作,2006(6):28-33.

(122)韩毅.语义网格环境下数字图书馆知识组织策略与应用研究[D].吉林:吉林大学博士学位论文,2008.

(123)毕强,牟冬梅,王丽伟.数字图书馆知识组织语义互联影响因素研究[J].图书情报工作,2009(15):12-16,57.

(124)牟冬梅.数字图书馆知识组织语义互联策略及其应用研究[D].吉林:吉林大学学位论文,2009.

(125)牟冬梅,陈倩,王丽伟.基于语义模型的数字图书馆知识组织信息抽取策略[J].图书情报工作,2009(15):21-25.

(126)毕强,牟冬梅,陈晓美.数字图书馆KOS的变革与创新[J].图书馆学研究,2009(6):11-14.

(127)毕强.数字图书馆知识组织系统建构的发展趋势——从机器可读到机器可理解[J].国家图书馆学刊,2010(1):12-17.

(128)司莉,舒欣.国外网络知识组织系统研究现状与发展趋势[J].图书情报知识,2008(5):82-85.

(129)冯玉,雷菊霞.学科信息门户的知识组织体系分析[J].情报理论与实践,2006(1):33-36.

(130)唐家玉,谢明,龙训田.学科信息门户的知识组织[J].图书馆论坛,2006(3):178-180.

(131)王飞.国家农业图书馆学科信息门户的服务与发展[D].北京:中国农业科学院硕士学位论文,2008.

(132)黄建年,侯汉清.关于TAG分类及相关理论问题的研究[J].图书馆杂志,2008(7):49-52.

(133)程慧荣,黄国彬,孙坦.国外基于大众标注系统的标签研究[J].图书情报工作,2009(2):121-124,133.

(134)张凌超,蓝沨.社会标注进展研究[J].情报科学,2009(11): 1753-1757.

(135)翟爽,宋文.社会标签在图书馆的应用[J].图书馆建设,2010(2):111-113.

(136)李爱国.三种学术标签系统的比较分析[J].图书情报工作,2007(2):114-116.

(137)羌丽,张学莲,侯汉清.图书大众标注评介——以豆瓣网为例[J].图书馆杂志,2009(2):21-26.

(138)杨秀丹,苏娜.国外民俗分类发展综述[J].图书情报工作,2007(6):59-61,36.

(139)王英.Folksonomy与传统分类法的比较分析及其完善研究[J].图书馆学研究,2010(理论版):45-47,74.

(140)陈洁,司莉.社会分类法(Folksonomy)特点及其应用研究[J].图书与情报,2008(3):27-30.

(141)袁志秀.自由分类法实例研究[J].图书情报工作,2008(9):52-56.

(142)周荣庭,郑彬.分众分类:网络时代的新型信息分类法[J].现代图书情报技术,2006(3):72-75.

(143)余金香.Folksonomy及其国外研究进展[J].图书情报工作,2007(7):38-40,74.

(144)梁桂英,李记旭.Folksonomy初探[J].图书馆杂志,2006(4): 46-49.

(145)毛军.元数据、自由分类法(Folksonomy)和大众的因特网[J].现代图书情报技术,2006(2):1-4,9.

(146)隆捷.基于标签的互联网自由分类法研究[D].北京:北京大学硕士学位论文,2007.

(147)岳爱华,孙艳妹.Taxonomy_Folksonomy和Ontology的分类理论及相互关系[J].图书馆杂志,2008(11):21-24.

(148)王梅.Folksonomy在图书馆中的应用分析[J].图书馆学研究,2008(7):45-47,38.

(149)唐晓波,金莉莉.基于分众分类的本体构建分析[J].情报理论与实践,2008(6):931-936.

(150)张燕萍.用分众分类模式优化学科导航库建设[J].情报理论与实践,2007(4):552-557.

(151)刘高勇,汪会玲.W iki与Folksonomy的专业信息服务研究[J].图书情报工作,2008(10):122-128.

(152)马费成,刘记.Web 2.0环境下的信息构建——对信息构建基本原理的再认识[J].情报学报,2008(5):683-689.

(153)刘记,等.Web 2.0环境下的信息构建研究(Ⅰ)——信息构建发展的新阶段[J].图书情报知识,2007(3):58-63.

(154)叶晓峰,刘记.Web 2.0环境下的信息构建研究(II)——IA2.0的评估:以博客站点为例[J].图书情报知识,2007(5):74-79.

(155)李琛,刘记,高静.Web 2.0环境下的信息构建研究(Ⅲ)——网站IA2.0设计分析[J].图书情报知识,2008(5):74-77,100.

(156)肖荣荣,等.Web 2.0应用情况调查分析及其启示[J].图书馆理论与实践,2009(9):22-24.

(157)司莉,石若瑶.Web 2.0在我国30所“211”高校图书馆应用的调查与分析[J].图书情报知识,2009(5):52-57.

(158)司莉,谭仪.Web 2.0在我国省市级公共图书馆应用的调查与分析[J].图书馆杂志,2010(5):20-23,40.

(159)杨晓菲.Web 2.0技术在高校图书馆中的应用研究[D].长春:东北师范大学硕士学位论文,2009.

(160)吴江.读者参与编目与数据对接初探[J].图书馆论坛,2009(2): 77-79.

(161)陈新元.我国高校图书馆适应Web 2.0环境的障碍分析[D].武汉:武汉大学硕士学位论文,2010.

(162)石若瑶.Web 2.0环境下用户的高校图书馆门户信息组织模式研究[D].武汉:武汉大学硕士学位论文,2010.

(163)陈红艳.Web 2.0环境下用户参与的图书馆信息组织模式研究[D].武汉:武汉大学博士学位论文,2010.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈