首页 理论教育 近五年国内外信息检索研究述评

近五年国内外信息检索研究述评

时间:2022-03-04 理论教育 版权反馈
【摘要】:作为我们上次对信息检索研究成果述评的拓展,本文旨在系统梳理2006—2010年以来国内外信息检索领域的研究进展,以期为同行更有针对性地开展相关研究提供借鉴与参考。我们利用中国知网、《图书情报学文摘》和ProQuest等检索工具获取本主题的文献300余篇,从信息检索的理论研究、技术研究、评价研究和应用研究4个方面进行总结,并对未来研究进行展望。此类研究主要围绕经典信息检索模型而展开。

近五年国内外信息检索研究述评

黄如花1 宋琳琳2

(1.武汉大学信息资源研究中心2.武汉大学信息管理学院)

【摘 要】文章对2006年以来国内外关于信息检索研究的成果进行了较为系统的梳理,从信息检索研究的理论、技术、评价和应用发展4个方面分析其主要特点,总结了该领域的若干热点问题,指出国内外信息检索研究中存在的核心问题及未来研究走向。

【关键词】信息检索 研究 述评 趋势

A Review of Research on Information Retrieval at H ome and Abroad in Recent Five Years

Huang Ruhua1Song Linlin2

(1.Center for the Studies of Information ResourcesWuhan University 2.School of Information ManagementWuhan University)

【Abstract】Based on the survey of academic research about information retrieval from 2006 to 2010 at home and abroad,the article analyzesmain characteristics of study on information retrieval from 4 aspects,such as theory,technology,evaluation and application,summarizes some hot topics in this area,points out problems in the study andputs forward some development trends.

【Keywords】information retrieval research review trends

信息检索历来是图书情报学研究的热点问题之一,而且,随着社会信息化水平的不断提高,信息检索活动已经逐渐渗透到人们生活的方方面面。面对海量信息资源,如何提高信息检索效率,如何进行信息资源的甄别和挑选,如何减少用户使用信息的负担等,信息检索领域各种问题引起了学者们广泛的关注。作为我们上次对信息检索研究成果述评(1)的拓展,本文旨在系统梳理2006—2010年以来国内外信息检索领域的研究进展,以期为同行更有针对性地开展相关研究提供借鉴与参考。

我们利用中国知网、《图书情报学文摘》(Library,Information ScienceAbstract,LISA)和ProQuest等检索工具获取本主题的文献300余篇,从信息检索的理论研究、技术研究、评价研究和应用研究4个方面进行总结,并对未来研究进行展望。但由于信息检索研究涉及的主题范围、工具类型、相关技术都十分广泛,本文难免挂一漏万。

1 关于信息检索理论的研究

信息检索的理论研究是开展信息检索相关研究的基础和保障,根据文献调查,参考已有的信息检索理论研究成果(2)(3),本文将信息检索的理论研究概述为理论探析、检索模型、检索算法、检索语言和检索策略5部分。

1.1 信息检索理论探析

1.1.1 多学科角度的理论探讨

在信息检索的理论研究方面,最突出的特色就是研究者从其他学科角度,如哲学、几何学、认知学、语境层次理论、劳动力理论、活动理论等,对信息检索相关问题进行理论阐述,并形成了新的信息检索理论。

Thornley从哲学角度研究信息检索,其系列论文讨论了语言哲学涵义与信息检索涵义间的不同,对理解信息和涵义两者间的哲学关系有帮助;认为哲学可用来处理信息检索中存在的一些难处理的问题(4);还从辩证论入手,探讨将辩证分析法用于信息检索理论研究,是否对更清晰地认识信息检索内部矛盾有所帮助(5);从理论上探讨了信息科学和信息检索面临的困难,认为导致困难原因是主观性的存在,也就是对信息的组织和描述能否与用户的需求相吻合(6)

张新民等从认知学角度剖析了认知信息检索相关的重要概念,如认知观、信息交互、情境、任务、多元表示、相关性等;对相关认知信息检索研究模型,如W ilson模型、Kuhlthau模型、Vakkari模型、Wang-Soergel模型、Ingwersen模型、Saracevic模型进行了评述(7)

张露从信息环境、信息搜寻、信息检索交互和查询4个层次概述了信息检索语境研究的理论概况(8)

Warner提出信息检索的劳动力理论,着重研究了信息检索中选择行为和筛选工具间的关系(9);讨论了信息检索的劳动力的分类,将选择劳动力分为描述和检索两部分,而这两部分同时包含体力和精神的双重性质;讨论了体力和精神两种劳动之间的区别,以及人工劳动向技术方面的转换和各类劳动的价值(10)

Wilson在2008年《信息科学与技术年度述评》(Annual Review of Information Science and Technology)中介绍了活动理论的起源及其在信息科学领域的应用与发展,并且以“信息素养”为例,介绍其在信息检索中的作用(11)。还有学者从活动理论的角度入手,对交互式信息检索的动态性进行了理论阐述,认为目前交互式信息检索的研究多从认知学和行为科学的角度进行,且在多种情况下都发现了动态性;而潜在的控制信息查询行为动态性的机制仍待研究(12)

Feldman提出一种与计算机科学无关的对信息检索的独特解释——信息检索的几何学(13)

1.1.2 检索模式的理论探讨

包括对传统的信息检索方式和新兴检索模式两个方面。国外使用较普遍且较新的信息检索教材《信息检索导论》(Introduction to Information Retrieval)一书对传统的信息检索问题进行了详细讨论,但没有涉及图像、声音、视频、多媒体等非文本信息的检索(14)。Amanda等对认知信息检索的用户系统的交互、信息检索过程、认知信息检索的相关性与整合性,以及知识需求和知识行为的重要性等进行了理论上的阐述(15)

1.2 关于信息检索模型的研究

关于信息检索模型的研究成果主要集中在以下三个方面:

1.2.1 对已有的信息检索模型的归纳和比较

此类研究主要围绕经典信息检索模型而展开。Zhai介绍了概率模型的发展和应用(16);刘海峰等人通过对信息检索的4个经典模型即布尔逻辑模型、向量空间模型、潜在语义标引模型、概率模型及其主要的扩展模型进行了评述(17)。王非等将信息检索交互系统模型进行总结分类,分为用于描述信息本质的描述型模型(E llis和Kuhlthau的模型)和用于说明如何在实际应用中实现相关支持的指示型模型(Belkin和Ingwersen模型)(18)。张小芳对基于关键词的检索模型、基于语义表述的概念模型、基于案例的检索模型和基于超链接分析的检索模型等4种信息检索模型进行了探讨和比较(19)。吴丽华等对信息检索模型研究的主要内容和构建策略进行了描述,并给出了几种常用的信息检索模型相关性算法(20)

1.2.2 对传统信息检索模型的分析和优化

研究人员多采用模糊集理论、矩阵模型、加权措施、添加语义分析、结合相关算法等途径对传统信息检索模型的优化进行研究。Sándor通过整合数学测量理论和模糊集理论,实现向量空间模型检索功能的完善(21)。Rolleke研究了信息检索建模的一般矩阵模型。在这个框架中,存储、检索都相当于矩阵空间,而检索特征,如内容、结构、语义等也用矩阵定义。这些空间的二元性由基于频率的操作和特征向量的含义来表示,以实现基于内容检索中使用术语赋值,并通过对相关文档间结构关系的开发,如Pagerank、授权等对术语间的语义关系进行定义(22)。樊红侠针对传统信息检索模型对不确定性知识处理的不足,提出基于粗糙集的信息检索改进模型,并以粗糙集技术为支撑,结合模糊集合理论,对查询进行泛化以提高查询性能,同时给出该模型的关键实现算法及性能评估方法(23)。张辉等在分析因特网环境下基于超文本的浏览模式和基于索引擎的检索模式两种信息检索模式的产生、原理和缺陷基础上,提出建立专业性的网络资源指引库、引入受控语言、应用智能代理、跟踪记录检索路径和内容提示以及使用语5点优化设想(24)。王修力等进一步改进文本信息检索各类模型的方法,重点论述文本信息检索模型的代数模型相关性、相似度、召回率、准确率等内容(25)。焦玉英等在分析传统的向量空间模型不足的前提下,提出改进向量空间模型的主要方法:在模型中运用文档类型和文档结构以及链接加权措施,从文档整体资源利用效用上改进检索系统;在检索匹配过程中加入语义分析机制,帮助检索系统理解用户的提问式,并对用户提问式的合理度做扩展分析(26)

1.2.3 建立新的信息检索模型

采用概率框架建立新的信息检索模型是信息检索模型构建的研究重点。Nottelmann建立的sPLMap概率框架,可基于框架所给的案例自动学习框架映射规则;通过概率解释,给选定的映射对象一个预估的权重;选择最具匹配可能性的规则集,然后输出概率规程用以处理映射过程中的内在不确定性(27)。Zhai的信息检索概率框架中,查询和文档都利用统计语言进行建模,用户的喜好通过损失函数进行建模,而检索则被视为将危机最小化的方式。该模型通过对副主题的检索,减少了传统检索工具对文档独立相关性的猜测(28)。王成等提出一种基于本体面向概念的信息检索机制的模型,更好地支持面向概念的语义理解(29)。刘斌等提出了改进向量空间模型的加权算法,并借助辅助主题词表和个性化信息库设计了新的检索系统模型(30)。方清华在分析具有代表性的信息检索认知模型基础上,提出了信息检索过程模型,对信息检索活动及相关的知识表示作认知分析(31)。冯兰萍等提出本体驱动的Web信息检索模型以解决当前Web信息检索中存在的问题,向用户提供本体的概念查询和语义扩充查询、语义缩小查询3种查询途径(32)

1.3 关于信息检索算法的研究

纵观近5年信息检索的算法研究,主要内容是对已有的各类算法进行总结与回顾,并且针对具体应用领域,对算法进行了适当改进。

1.3.1 总结已有的各类算法

高炜等将现有的排序算法分为基于链接分析和基于机器学习两大类,系统地分析了各自代表性算法,指出它们各自的优势和存在的不足,并指出不同算法在不同领域和场合所具有的优势(33)。余洋则介绍了聚类算法在信息检索中的应用过程(34)。Sándor基于点阵理论介绍了信息检索代数算法的演进(35)

1.3.2 针对具体应用领域适当改进算法

针对信息检索中的词语不匹配问题,陈晓金提出一种结合本体理论和用户相关反馈技术的查询扩展算法(36)。为提高Web信息检索的质量,金玮在经典的关联规则算法研究基础上,通过引入多维链表结构,提出了利用事务集合匹配运算和链表操作高效地挖掘关联规则的算法ARML(37)。为实现迅速查询评价,Sheng等提出的PBDIA算法可以对文档中保存的常用检索术语有效地分配连贯的文档标识并压缩术语,以节约检索查询处理时间(38)。为挖掘和生成核心标签,Isabella在探寻标签分布规律的基础上,将标签分为检索用标签和索引性标签,从而提出挖掘和生成核心标签的运算法则(39)

1.4 关于信息检索语言的研究

关于信息检索语言的研究仍然强调对传统情报检索语言的改进、关注自然检索语言和计算机化检索语言应用。

1.4.1 传统情报检索语言的改进

传统信息检索语言一直都是检索语言研究的重点,涵盖范围广泛,如词汇、词表、分类法、主题索引、匹配、控制机制、中文分词技术、术语赋值等。全国第五次情报检索语言发展方向研讨会讨论了网络环境下检索语言的创新与发展,探析了分面分类发展路向、情报检索语言在网络环境中的发展趋势、Internet环境下情报检索语言的语用研究、知识组织系统及其描述与评价、基于本体的网络知识组织系统研究、叙词表编制国家标准比较研究及国外叙词表在网络环境中的应用现状、电子化环境下的叙词规范控制模式、网络时代专业叙词表选词规则、分类主题一体化中特征词的研究等一系列的内容(40)。侯汉清主编的《情报检索语言与智能信息处理丛书》从情报检索语言的自动化和自然语言检索两个相关方面,研究了信息检索自动化的升级问题(41)

学者们关于词汇的研究中,对同义词、相关词、排除词、修饰词等,结合知识发现和挖掘技术,进行了重新的定义,并构建了模型以研究其在信息检索中的作用。章成志等针对信息检索中词汇知识发现问题,提出面向信息检索的词汇知识发现框架结构,对面向信息检索的词汇的定义、同义词、相关词、排除词等词汇知识获取与挖掘进行详细介绍(42),并针对信息检索中存在的词语排除关系问题,给出排除词的定义,指出排除词实质上是最大准交集型歧义切分字段的伪歧义切分所导致的,描述排除词的识别方法,并给出识别的结果(43)。马晖男等通过构建修正的向量空间模型来研究信息检索中修饰语作用(44)(45)。中文分词技术备受关注,孙巍提出一种面向中文信息检索的汉语自动分词方法(46);吴凡分析了信息检索中的中文分词歧义问题,引入N元文法和平滑算法对切分歧义问题和数据稀疏问题进行处理(47)。孙西全等研究了Lucene和中文切分词技术,分析了Lucene的索引原理,实现了一个基于并支持中英文文档检索的应用实例系统(48)。李育嫦分析了传统受控词表、叙词表、同义词表、一体化词表、禁用词表等词表在网络信息检索中的应用现状及分析(49)

关于分类法的研究侧重于应用领域。Khaltar采用归类方法对蒙古文中的斯拉夫文进行信息检索实验,其优势是不再依赖于名词字典,确保归类不受字典的约束(50)。Broughton对分面分类法和分面分析在信息检索中的作用进行了介绍,并通过对多类用户指标或数字资源检索的主题检索工具,主要通过商业网站的调查,发现分类系统在图书情报学分类、主题标引和术语表等主题索引工具,商业网站的信息描述,半自动化索引和检索中都有应用(51)

研究人员还试图通过标准化手段,如控制机制、匹配、索引等,实现各种检索语言的兼容。赵丹群对信息检索系统的“后控制”的三种类型,即查找前的提问式构造与扩展控制、查找中的检索过程控制、查找后的检索结果控制与优化进行分析和阐述(52)。A resenault在信息检索整体模型中应用了控制语言,并且将其与使用自然语言的系统在优缺点上进行对比,还讨论了以本体形式存在的控制词汇、自动检索和交互操作语义系统(53)。何绍华认为查全率和查准率不高的主要原因在于:检索算法采用词型匹配而非词义匹配以及对来源信息的标引缺乏语义描述信息,提出采用语义信息标引方法和语义查询扩展方法来改善查全率和查准率(54)。Sheng等提出“单一次序添加编码”方法,通过消除递归和循环平仓,利用二进码预估每个文档标识的最低和最高限,从而缩小解压时间;并利用文档标识聚合来有效压缩倒排文档,建立信息检索系统最合适的索引框架(55)。Cummins根据遗传学的成功经验,介绍了两种不同的术语赋值机制处理方法,显示不同的处理方法如何聚类(56)

1.4.2 自然语言处理

自然语言处理研究既有对应用技术的宏观把握,也有对新技术的研发充分关注。Kastner综述了计算机语义学最新的研究成果和自然语言处理方面的成果,尤其是信息科学的索引和元数据领域(57)。王灿辉等总结了自然语言处理在信息检索中的应用情况,如基本或高级自然语言处理技术的应用、在语言模型中加入自然语言处理及应用效果;认为自然语言处理更适合于应用在需要精确结果的任务中,在信息检索模型、语义网络构建等方面的应用前景广阔(58)。Gian介绍了叙述资源描述语言NKRL技术在南菲律宾解密文档中的应用(59)。Chen研发了LKB技术,即建立一个词汇知识库,并利用它实现检索式翻译,以解决自然语言处理领域中存在的超出字典或与词汇表不匹配的问题(60)

1.4.3 XML语言检索

XML语言检索的研究既涉及数学计算,如鲁远提出了一个XML信息检索中计算用户查询与检索结果相似度的数学模型(61);又包含具体实践应用,如龙泉等提出利用独立的文本检索系统(Okapi-X)和图像检索系统(GIFT)相结合的方式来实现基于XML的图像检索(62)。夏立新等研究了基于OKAPI的XML信息检索的实现技术(63),以及基于XML的全文检索原型系统的设计(64)。还有对未来研究热点的展望,如廖述梅等认为融合信息检索和数据库技术研究XML检索问题成为必然,并预测XML的研究热点和难点问题为基于XML的形式模型和代数理论、近似查询处理和灵活通用的计分排序方法(65)。陆伟等通过综述2005年INEX的XML信息检索国际会议,认为XML的主要研究包括:交互式XML检索、多媒体XML检索、XML相关反馈研究、异构XML检索、XML文档挖掘、XML自然语言处理及XML评价方法(66)

1.5 检索策略

检索策略包括检索课题的分析、选择合适的检索工具、选择合适的检索词、编制检索式等。目前国内外检索策略研究的入手点是针对信息检索中存在的具体问题提出解决方案;既有从技术改进、系统调解入手,也有从规范用户的检索行为入手,提升信息检索效率。陈军莲从网络信息数量、网络信息质量、计算机病毒的破坏和危害、网络用户自身素质、硬件设施5个方面分析了网络信息检索中存在的问题,并提出了对策(67)。沈建人提出从优化查询项、优化相似度计算方法两个角度改善信息检索效果(68)。Mac认为本地搜索可以实现信息检索的整合最优化,通过提供基于分类法的查询,总结了关于匹配功能、显著性统计、测试文档等问题(69)。Ronald认为要提高全文检索的功能,就应该利用整合的检索词以增强其说明能力(70)。另外可以通过系统调解的方式,获取更完善的检索结果。Lee研究了面对多角度复杂的检索任务,调解系统的交互模式和结果显示模式的作用(71)

在规范用户检索行为方面,A lison等为网络检索者提出如何有效、合理利用搜索引擎进行文本资源检索的方法,以及为达到该目标如何开展培训项目,从检索工具的选择、检索式构建、检索工具工作原理、信息来源质量评价和如何开展信息检索技巧培训课程等方面进行了详细的介绍(72)。Laura认为,信息检索的当务之急不是如何创新和维护信息检索系统,而是帮助用户如何快速查找到所需资源,提出了6个策略,即学会删除、创建“档案橱柜”、为每个文档予以准确的名称等(73)

2 关于信息检索技术的研究

信息检索技术主要包括分布式检索技术、本体技术、智能信息检索技术、跨语言检索技术、多媒体检索技术、搜索引擎、交互式检索技术、检索结果处理技术等类型。

2.1 关于分布式信息检索技术的研究

近5年对于分布式检索的研究,主要集中在数据的爬行收集技术和P2P技术两方面。

2.1.1 数据的爬行收集技术

研究者针对分布式信息环境中如何更好地收集数据,如何对收集到的数据进行处理进行深入研究。Lu参考OAI协议,提出一种处于数据爬行和分布式检索之间的基于内容的分布式信息检索方式,可以在爬行过程中自动去除内容统计数据和非索引的数据分布的资料,降低检索成本、扩大检索范围(74)。Fabio则将研究重点放在基于内容的分布式检索元数据收集,认为元数据收集应处于数据爬行和分布式检索之间,既保持集中式检索的成本效益、大范围共享;又借助OAI协议拓展,对全文内容索引和描述性元数据进行协作采集(75)。雷雪对分布式检索中信息集选择方法进行总结和评价(76)。张卫等采用了不平衡的分割方法将索引数据分布在不同PC机上,以增加系统的查询吞吐率,实现分布式检索(77)

2.1.2 对等网络技术

对等网络技术(peer-to-peer network,P2P)可以实现网络中的任意节点都参与到检索过程中,是实现分布式检索的重要进步;其研究集中在P2P的检索模型、在全文检索中的应用、支持模糊检索和加强用户模式等方面(78)。赵悦等针对P2P网络的稳定性,提出层次化分布式哈希表系统——PDHS模型,通过把P2P网络中节点划分为多个组,保证各个节点完全对等,避免了单点瓶颈(79)。Rosenfeld提出基于P2P数据库实现有效全文检索的系统PH IRST,通过综合结构性和非结构性两种检索途径,改变各检索途径间的相对强度发挥作用,避免重复存储、降低查询费用、及时发现节点故障等(80)。刘洪涛等提出了一种基于语义相似、本体匹配的P2P信息检索方法。通过计算语义相似度,在网络中进行语义匹配来部分替换传统的字符串相似度计算(81)。陈磊等介绍了基于文件内容和基于节点的信誉评价系统模型,通过收集各个节点的评价信息,来保证共享文件的真实性和可靠性(82)

2.1.3 整合技术

分布式检索的整合包括检索模式的整合、检索系统的整合以及检索结果的整合。焦玉英提出网络/传输层的互操作、数据/语义层的互操作、异构分布式资源检索协议3种异构分布式信息检索系统整合策略(83)。王翠萍等论述了数据库整合、检索结果整合、应用程序整合和网络信息检索系统整合的步骤和方法,构建了数据库整合和网络信息检索系统整合的模型(84)。Xie等提出将向量空间模型、机器学习技术和语言建模技术进行整合,根据信息需要自动判断最佳的向量空间(85)。Ma建立了主题结构的模型,检索整合用户感兴趣的跨媒体的新闻内容(86)。检索结果整合的研究述评参见2.8.2信息检索结果的整合技术。

2.2 关于本体的研究

基于本体的信息检索主要关注相关技术研究、模型构建研究、应用研究等方面。

2.2.1 基于本体的信息检索机制

基于本体的信息检索机制主要指利用描述逻辑建立本体的形式化模型,设计本体术语包含关系的检验算法,将信息的检索过程抽象为有限状态的自动机的推理过程。涉及基于本体语义模型的信息检索机制研究,基于本体的跨语言信息检索机制研究等。吴丹等探讨本体应用于跨语言信息检索最关键的多语本体库的映射方法,认为采用中间语言作为概念表示、并通过词典翻译对照与不同语种的词汇建立链接关系是多语本体映射的一种良好方法(87)

2.2.2 模型构建研究

模型构建研究主要关注基于本体的族式返回检索模型、基于本体的多主体知识检索模型研究、基于本体的跨语言信息检索模型、基于本体和多代理的数字图书馆信息检索模型、基于检索相关性转移的本体论情报检索系统模型和网络本体语言构成的理论模型等。如将两种基于HowNet的技术结合起来,利用语义处理技术为文档和用户需求分别贴上标签,采用单词链技术来过滤文档的标签。从而实现语义层面匹配,降低信息检索中大量不相关信息干扰的SOIRS模型(88)

2.2.3 基于本体的信息检索应用研究

基于本体的信息检索应用研究包括本体论在语义检索、搜索引擎、知识检索、智能信息检索、文本信息检索、跨语言信息检索、数字图书馆信息检索等方面的应用研究。Giuseppe设计了语义本体匹配器,研究语义技术在本体映射以及在匹配方面的作用(89)。Silvia提出利用模糊的本体来改善语义检索(90)。王兰成等讨论本体论方法在文献型信息检索系统中的应用(91)。杨建林对如何构建基于本体的文本信息检索系统进行了探讨(92)。Papadakis根据美国国会图书馆主题词表(LCSH)的语义关系建立一个本体,作为一个基本模型用于数字图书馆主题检索,并且提出一个对数字图书馆学位论文资源的检索框架(93)。Saravanan利用本体实现对数字化后的法律文献进行语义检索(94)

其他相关研究涉及本体在信息检索中的应用背景、现状及发展前景研究,信息检索的嬗变,情报语言学的发展,叙词表、分类法、元数据与本体的比较研究,信息检索中存在的问题及发展方向研究等(95)

2.3 关于跨语言信息检索技术的研究

跨语言信息检索(Cross Language Information Retrieval,CLIR)是信息检索领域研究的热点和前沿,每年国际上都会召开针对CLIR的专题会议,其中定期召开的国际会议分别是文本信息检索国际会议(TREC)、亚洲语言信息检索评测会议(NTCIR)和跨语言评价论坛(CLEF)。也涌现出很多跨语言信息检索系统,如Aport、Arctos、Eric和Mulinex等示范系统和Cindor、Rotondo、Text-Finder等商业系统。Kishida认为在跨语言信息检索中用于提高检索效率的技术主要包括:匹配策略和翻译技术、解决翻译歧义的方法、跨语言信息检索模型、语言途径和核心部分、查找多种语言文档内容的方法、整合多语言资源的方法(96)。杨丽则认为,匹配提问词与文档表示的技术、翻译技术、合并语言资源的技术是跨语言信息检索领域的主流技术(97)

笔者通过文献调查发现,近5年跨语言信息检索领域的研究重点体现在以下几个方面:

2.3.1 跨语言信息检索中的翻译消歧

跨语言信息检索中存在多种翻译消歧技术。张素芳综述了词性标准、平行语料库、词的共现技术、提问式扩展、提问式构造、双向翻译、习语翻译等消歧技术(98)。吴丹提出了对查询进行结构化处理、通过语言分析帮助消歧、借助机读化语言资源进行消歧以及通过人机交互消歧4种跨语言信息检索翻译消歧方法(99)。Nie介绍了如何在机器检索中实现翻译消歧(100)。Kishida认为较之伪相关性反馈技术,利用术语在文档集中的同现统计方法的变形更具优势(101)。有学者建议利用来源文本的背景条目的感觉模糊性,通过扩展IBM的模型1,使基于语境的翻译检索变为可能(102)。吴丹通过多语本体的引入提高语义排歧的准确性(103)

2.3.2 跨语言信息检索中的翻译资源构建

跨语言信息检索中的翻译资源构建研究,主要通过中间语言技术、基于语料库技术和合并语言资源技术3种方式实现。

中间语言技术研究方面,Tuomas将基于辞典的翻译、文本翻译技术结合起来,建立可比较文本集,再通过一个基于辞典的查询翻译程序,进行检索匹配(104)(105),并且以芬兰和瑞典语为样本,进行可行性实验(106)。Abdeighani将近似匹配技术与N-gram技术集合起来,处理不同的字母表并排除词形相似、词义差别很大的词(107)。德国联邦教育与研究部资助的术语映射项目建立了一个用于组织、创建和管理控制文档间的交叉意义索引(108)

基于语料库的方法研究中,Li从中文网络文档中抽取英文术语,然后将抽取的术语及其同义词与中文整合为一个索引单元。并采用网络挖掘的方法,实现不同术语在概念上的统一(109)。Cosijn对出现在报纸中的单词频率进行统计,并建立一个停止集,用于描述大部分南非公用荷兰语的正常化语态形式,方便跨语言检索的翻译(110)。赵欣等利用互联网上丰富的双语资源和查询翻译模型构建技术,研究了语料库的构建和使用(111)

合并语言资源技术研究中,Daumke建立包含6种语言的多语言辞典,利用术语替代词,实现基于替代词和word-n-grams在查询和文档间的调解,实现网络生物医学的多语言检索(112)。Jong将三种翻译模型进行整合,且根据每个模型提供的网络数据和相关性数据进行排序,以提高翻译检索精确率(113)

2.4 关于智能信息检索技术的研究

在智能信息检索的研究中,学者们主要关注各类新技术对智能信息检索的作用,如语义技术、资源描述框架(Resource Description Framework,RDF)、智能代理技术、数据挖掘技术、神经网络和机器学习等。

2.4.1 语义技术

Youakim对网络信息检索中所需的语义技术进行了全面的讨论(114),语义技术研究中尤其关注本体在智能信息检索中的应用,研究者通过元数据的提取、领域本体的构建、语义标注和推理机制构建基于语义网的智能信息检索系统(115);使用本体对Web页面进行标注,结合CBR的推理能力,构建Ontology与CBR集成的Web智能信息检索框架(116)。Aswani提出数字图书馆开展智能检索的两种方式,即空间向量检索和潜在语义检索,并针对潜在语义检索设计了一个检索模型,通过提问预处理、余弦相似性计算、结果排序和评价等步骤实现智能化检索(117)

2.4.2 RDF

RDF方面主要是基于RDF框架建立智能网络信息检索系统,如基于RDFS的MPEG-7语义元数据通用参考模型,实现基于语义的智能多媒体信息检索系统框架(118);为解决网络环境的异构性、动态性、链接的不可靠性、资源的局限性等问题,利用XML/RDF技术实现的基于RDF数据空间的网络信息检索智能化系统架构(119)(120)

2.4.3 数据挖掘技术

数据挖掘技术可以达到在复杂、海量、非结构化的数据中发现资源并将其中的信息提取出来进行处理的目的。王艳设计了包括信息采集模块、网页预处理模块、语料库维护模块、词典维护模块、机器学习模块、文档分类模块、系统配置等模块的通用的基于Web文本挖掘技术的智能检索系统原型(121)

2.4.4 机器学习技术与智能代理技术

机器学习技术主要用于智能信息检索的数据挖掘(122)、术语赋值(123)和自动映射领域(124)。而智能代理技术主要是为规范用户检索式,提出词语建议(125);同时还可采用多智能Agent协作模型,通过Agent之间通信,开发新的规划和求解方法(126)。智能信息检索应用的技术还包括数据聚类中的神经网络技术等(127)

2.5 关于多媒体检索技术的研究

多媒体信息资源检索一直是国内外的热点与难点,其关注的重点首先是结合其他学科知识,对多媒体信息检索的发展;其次是如何对各种类型的媒体进行独立检索,再次是如何改善多媒体检索模型的检索功能。

2.5.1 多学科角度的研究

Zhang从语义角度研究视觉信息检索,认为用户的语义需求与计算机的简单识别间存在很大的代沟,从简单特征与语义层次、图像和视频注解、人机交互、语义检索模型和工具、语义检索应用技术等方面研究两者间的关系(128)。Sara从信息科学的角度综述了用于视觉信息检索的CBIR系统的发展(129)。Christopher从感知理论的角度,通过随机特征模型实验,发现感知度越高,视觉信息检索的速度越快(130)。Chu从信息描述的角度介绍了如何开展有效的多媒体检索(131)

针对不同的媒体类型,研究者重点介绍了提供独立检索的各媒体数据库,如iPhone和黑莓使用的音乐检索系统M idomi和Shazam(132);典型视觉信息检索系统C-BIRD、MARS、Video和QVIQS等(133)

2.5.2 多媒体检索系统的完善

研究者通过多种技术完善多媒体信息检索系统的功能,如尝试建立多媒体数据流模型(134);对用户在浏览多媒体信息时产生的感情通过语义标签和文字注释予以说明(135);将基于内容的检索和基于文本的检索两种技术整合,以提高检索精确度(136);对于静态图像通过基于颜色、纹理、形状等图像特征信息的检索;对于视频序列,则通过特征提取、相似性测量等方式进行检索(137);以及信息可视化技术(138)(139)(140)

2.6 关于搜索引擎的研究

近5年,搜索引擎的研究重点集中于搜索引擎的优化和搜索引擎的评价研究。

2.6.1 搜索引擎的优化研究

搜索引擎的优化技术是该领域的研究热点,涵盖优化技术的选择(141)、检索方式的整合(142)、搜索引擎设计技术(143)、检索效能的提高(144)、来源网页的筛选(145)等方面。如从网页关键词策略、URL、代码、结构、网站结构及链接策略等方面入手(146)(147)(148)(149),从搜索引擎优化的编程技术角度(150)(151)(152),从搜索引擎优化的营销策略方面(153)(154)

2.6.2 搜索引擎的评价研究

搜索引擎评价研究的内容涉及搜索引擎的很多方面,包括用户利用搜索引擎情况、跨语言、图像检索、元搜索引擎、电子商务检索、多媒体检索、搜索引擎偏见、搜索引擎的检索功能、搜索引擎结果重合度、检索结果排序、检索结果一致性、竞价排序网页、布尔逻辑等。Stefan等就搜索引擎评价的相关方面进行了综述(155)。而且搜索引擎的评价研究已形成完整的搜索引擎评价指标体系(156)(157),在众多评价指标中,最重要的还是搜索引擎的检索效能。马费成等通过研究得出搜索引擎的检索效能最常用的测度指标是查全率和查准率。此外,影响用户检索效能的指标还有搜索引擎返回结果文档的排序质量、重复度,而索引的数量、用户满意度等指标都会影响用户使用的效果(158)

2.7 关于交互式信息检索技术的研究

交互式检索研究强调结合用户的行为背景信息,通过交互式检索系统的设计、检索模型、技术和策略的整合,推广该检索系统的应用。Amanda预测未来交互式信息检索的研究方向有:认知性研究,获取对人机交互检索的动态认知过程;社会和组织层面的研究,为了需要加大在社会和组织层面对人类交互的研究;相关性和评价研究;发展和调整交互式用户系统模型(159)。当前主要的研究热点包括以下方面:

2.7.1 用户信息行为背景

整合个人信息检索行为,试图创建一个更全面的对交互式信息检索的理解,需要重视人机交互检索发生的人类信息行为背景。Ruthven认为评价交互式信息检索系统的功能优劣,主要看其可以利用多少背景信息来方便检索(160)。Bai提出主要的背景信息特征有查询的主题领域、文档收集的特征、检索式中的背景词汇。每一个背景特征都将形成一个新的检索语言模型,并具化为信息需求的一些特征。将这3个模型整合到一起,来分析潜在的信息需求(161)

2.7.2 交互式信息检索系统的设计技术

交互性信息检索系统在设计方面尤其需要对反馈技术、个性化技术、可视化技术、自动辅助技术进行深入研究,而在查询使用过程中,与用户交流的沟通技术、对查询日志的深入分析技术以及多重查询重构技术等,都影响交互式信息检索系统的检索功能(162)

2.7.3 交互式信息检索的应用

交互式信息检索系统的应用范围广泛,尤其在帮助用户通过信息检索获取所需信息方面的作用不容小觑。Xie介绍了数字环境下交互信息检索的发展,认为交互信息检索可以用于各种数字资源检索,如OPAC、在线数据库、网络搜索引擎、数字图书馆、交互跟踪环境等,主要研究交互式信息检索对实现信息畅通交流的作用(163)

2.8 关于信息检索结果处理技术的研究

信息检索结果的处理技术主要是对检索结果进行排序和整合。

2.8.1 信息检索结果的排序技术

在检索结果排序技术方面,可分为基于链接分析和基于机器学习两大类(164)。研究者倾向于利用数学方法,如对数透视原理(165)、加权机制、损失函数、构建数据矩阵、概率模型等进行计算。对于中文信息检索的文档重新排序,可基于术语权重模型,将本地和全球分布的术语以及文档频率、位置以及术语长度等进行了整合,通过加权机制设置检索文档和相关性反馈,来改善文档重新排序时最大边际相关性的性能,进行文档重新排序和相关性评价(166)。在数据库检索结果排序中,可通过概率模型将信息检索转换为结构化数据,促进数据、工作流量统计及其相互关系变化,来处理链接和查询排列等问题(167);或是通过数学算法提高检索结果和检索目标相关性(168)。基于机器学习方面,可以对机器人收集的信息进行链接分析,并构建数据矩阵,以便对网络信息检索中的排序技术进行对比,如PageRank的优化(169)

2.8.2 信息检索结果的整合技术

信息检索结果的整合主要存在合并技术和聚类技术两种技术路线。合并技术方面,Liu等提出将回归分析与选择性下载结合起来的复合型运算法则(170);Paltoglou提出通过选择性下载并预估相关性能高的方法(171);Fernando提出的伪相关反馈技术(172)等。Crestani则认为在分布式检索结果的处理上,聚类方法要优于合并;并且对聚类假设在多重复杂环境中进行了验证,结果显示虽然聚类假设受到不同检索结果的表述以及质量的影响,该假设依然成立,而且在多重分布的信息检索环境中使用分等级的聚类是将检索结果提供给用户的很有效的方式(173)。Claudio认为对于桌面检索和移动检索,应该使用聚类引擎对检索结果进行处理(174)

2.9 其他信息检索技术的研究

除上述介绍的主要的信息检索技术外,影响信息检索效果但研究成果有限的技术还有:①信息检索系统设计中的技术问题(175)(176),涵盖网页设计(177)、资源存储管理(178)、数据聚合与复制(179)(180)、动态缓存(181)、文档描述(182)、文档抽取(183)(184)等。②信息检索过程中具体问题的处理如检索式翻译与调整(185)(186)、权重赋予(187)、检索特征定位(188)(189)等。③应用于具体系统的信息检索技术,如过滤技术(190)、自组织地图(191)、形态变异管理技术(192)、个人隐私保护技术(193)和消歧技术(194)

3 关于信息检索评价的研究

近5年信息检索评价的研究受到了更多的关注,出现很多信息检索评价活动,如TREC、NTCIR、CLEF、中文Web信息检索论坛(ChineseWeb TestCollection,CW IRF)和信息检索评价论坛(Forum for Information Retrieval Evaluation,FIRE)。而且出现的大量可用测试集也保证了信息检索评价持续稳定的进行。Voorhees介绍了TREC在此方面所作的贡献,主要是提供信息检索评价实验数据集,从特定的任务和用户中抽取细节,已形成名为测试集的标准(195)。同时还列举了历届TREC会议的成果,介绍了TREC下属的7个主要的研究领域的研究现状,总结了TREC对信息检索领域如信息检索自身、其评价、网络搜索的贡献(196)

传统的信息检索评价主要基于相关性评价,如采用Cranfield的评价模式,开展信息检索评价需要的基本要素为:对信息需求的描述、一定的文档收集、系统对比、信息检索观察员根据信息需求描述信息集合简述情况,以及对系统进行计量统计。对于这些基本要素,例如为获得有效的结果需要多少数量的要素、检索系统、观察员以及观察判断;有效性如何测量,哪一种计量最可靠,哪一种计量对用户最合适等,都是研究的内容(197)。尤其值得注意的是,以用户为中心对信息检索过程开展评价成为本领域一个备受关注的热点。

3.1 关于相关性评价的研究

Saracevic对信息检索的相关性进行了系统研究(198);认为信息检索评价主要是对相关性的评价,如系统的相关性、用户的相关性。但是用户相关性又是一个主观的概念,有时存在很多不一致性。这种不一致性评价出的相关性自然受到质疑,并对不一致性进行了研究(199)。Schatz讨论了在相关性评价的有效性遭到质疑的情况下,如何通过Spink的信息需求评价和Cooper的有用性评价两种新的测量方法来开展评价,这两种工具可分别用于基于标签和文本的评价。通过实验证明,以上两种工具与传统的评价工具间具有很强关联性(200)。Sakai将14种基于分级相关性与10种传统的基于双重相关性的计量进行了统计比较,涉及稳定性、敏感性、相似性等,通过NICIR的数据集进行测试,证明基于响应的分级相关性计量与平均精确率密切相关(201)

国内学者对相关性的研究更侧重从宏观角度的把握。韩毅等从历史发展过程讨论了相关定义、主题相关、逻辑相关、情境相关和认知相关等理论内涵(202)。庞弘燊等从模型、算法、聚类、查询扩展与精化、相关性判断等方面综述了国外信息检索的相关性研究情况,重点介绍了相关性的基础性研究和关于检索系统的相关性研究(203)。也有学者从其他角度对相关性理论进行阐释,如成颖将语言学中的关联理论作为相关性研究的理论基础(204),郝斌则对不同类型本体信息检索模型式下的相关性表现进行了对比研究(205)

另外,学者还对用户角度的相关性判断进行研究。Xu从以用户为中心的角度进行相关性判断,将相关性看作是一个主观的、多维度的动态的概念,其中涉及两个要素,即代表性、新奇性,目的是在交互信息检索中,通过主观的新奇性判断来提供基于典型性的用户相关性判断(206)。程娟通过获取用户的相关信息建立相关反馈模型(207);Cosijn主要研究信息检索系统如何支持用户做多维度的相关性判断,如认知相关性、环境相关性、社会认知相关性等(208)。K richel探讨了用户的满意度与检索结果的排序是否密切相关,利用矢量空间评价方法,认为将NOSEL和copnori两种方法相结合,可以测度两者间的关系(209)

3.2 关于信息检索统计评价模型的研究

通过统计评价模型开展评价实践主要是对信息检索过程中的数据进行统计测度,构建评价模型或指标体系,通过数学计算对信息检索效能进行定量评价。成颖等利用关联理论的信息处理模型阐释了信息检索交互模型中的相关性评估模块,认为采用关联理论的信息处理模型阐释信息检索的相关性判断过程是可行的(210)。李树青等提出通过有用性、网页质量直接测度和网页质量间接测度3个指标改进基于网页质量分析方法的Web信息检索模型(211)。王启云从网络信息表示、网络信息检索结果、网络信息检索功能、网络用户负担4个角度探讨网络信息检索效果评价指标体系设计(212)。Diana等针对信息检索系统的评价过于分散、不连贯的现状,试图建立一种全面整合的、多标准的基于决策理论模型的评价体系,其特点是将用户方面包含其中,以及在信息检索中使用的决策理论(213)。在后续文章中,作者进一步将信息检索评价内容拓展为检索过程和检索结果两个方面,并且确定了决策理论方式的优越性(214)。Saboori建立了基本评价模型Rocchio,对信息检索系统的检索式扩展技术的效率进行评价(215)

3.3 关于信息检索评价方法的创新研究

在信息检索评价中引入新的评价方法,如启发式评价方法、引文分析法、统计计量方法和数据聚合筛选方法等,可以推动信息检索评价的科学发展。Sakai在相关性评价中引入Buckley/Voorhees稳定性方法、Buckley/Voorhees交换法、Kendall's排序联系法等(216); Zabed通过对检索系统界面的启发式评价使用,证明启发式评价对在线信息检索系统评价的可行性(217)。其在后续文章中通过用户对WOK数据库的使用研究,得出结论:启发性测试可以获得更多的定性信息,这些信息通过可用性测试无法获取。所以在进行界面可用性评价时,应该多种技术并用,才能够做到全面有效(218)。Nuray提出利用数据聚合进行筛选的新方法,利用偏差概念来测量一个系统与标准及主流系统的差距,然后在数据聚合过程中使用这种高度的偏差,对信息检索系统的有效性进行自动评价(219)。Gabel则研究如何利用引文分析来改善学科检索的评价(220)

3.4 关于用户信息行为评价的研究

邹永利等认为影响网络信息检索的用户因素包括:用户的信息意识与信息能力;用户的思维、情感状态因素;用户个体差异性的因素(221)

以用户信息行为为中心的评价就是请用户使用信息检索系统,观察用户解决信息检索任务的过程。在这一测试中,用户的表现可通过观察他们找到的相关文档来测量。这个结果与相关性的认同标准进行比对,来评价感受到的相关性与观察员判断的相关性的关系。同时还涉及用户满意度的问题,关于检索系统和检索结果等方面。近几年,关于检索结果与用户研究相关度的研究增加。当检索系统提供更多相关结果时,用户的满意度是否随之增加,用户是否从中获益,是否能确保用户获得更多相关文献等都是研究内容。

目前用户信息行为的评价研究主要关注:如何利用用户评价完善信息检索系统、对用户检索行为多学科的理论探讨、用户信息行为的评价方法创新以及用户检索行为的实证研究。

3.4.1 利用用户评价完善信息检索系统

利用用户评价完善信息检索系统涉及信息检索系统的各个层次,如系统设计方法、系统新功能。①界面设计方面,Ahmed通过邀请专家对WOS检索系统的检索界面进行评价发现,界面设计的主要影响因素是风格一致性、屏幕显示、颜色最少化、图表(222)。②系统设计方法上,Keshavarz从用户信息行为角度来设计和评价信息检索系统,其将信息检索系统设计方法总结为以系统为中心、以用户为中心、交互式和认知式4类,着重研究基于用户信息行为的系统设计方法及研究框架并对其应用可行性进行了分析,作者认为背景设计和共享设计是一种基于用户信息行为的信息检索设计与评价的新发展(223)。③系统新功能的提供方面,Ryan研究了信息检索系统在提供新的检索功能时,设计者应选择避免控制的自动方式,还是允许控制存在的交互方式给用户。通过实证研究证明,用户希望在检索过程中尽量不受控制,只是在构建检索式和做检索决定时才希望得到帮助(224)

3.4.2 基于用户检索行为的评价方法创新研究

基于用户检索行为的评价方法创新研究中,研究者更关注在建立用户评价模型或是在某一具体的信息检索模式或模型中革新评价方法。

在用户信息行为评价中,可以通过复制检索系统的具体部分、设置交互监视装置、检索结果聚合、深入分析查询日志等方面开展评价。Petrelli认为以用户为中心的评价方式,是一种灵活、可变化、全面的非传统的方法,认为欲评价某一具体模型,可以对复制该系统的某一部分的有效性进行微观评价(225)。Ryan在交互检索的用户检索式的制定研究中,设计了一个采用不明显的交互监视装置,通过监视用户与排在前面的检索结果之间的交互,选择合适术语提供给用户。同时还提供预估信息需求程度、预估需求变化程度,以及界面对此类技术的支持度等评价工具(226)。Smullen则提出一种在信息检索系统中增强对用户需求理解的方法,通过对检索结果的聚合来推断用户当时的检索兴趣,并依此对每个用户的大体特征进行概括,以便在特定查询中进行基于背景的推断(227)。Yi通过从不同层次分析查询日志,找出两类数据库之间最佳的分类数据、比较两类数据库间的不同以帮助理解用户的检索行为和信息需求两种方式,认为在查询分类中多词术语可提供最有效的用户检索行为的快照,而且在平均检索词的长度上,数据库检索的词长与搜索引擎接近(228)

建立用户评价模式或生成影响因素集是开展信息检索评价的工具之一。Philip提出一个模型,通过辨别由于获取新知识改变检索目标和由于旧知识的影响改变检索目标两者间的差别,来解释用户的检索目标在检索过程中不断调整(229)。B.Piwowarsk基于大量的用户行为,提出一个详细、正式的用户模型。基于这个模型,可对信息检索模式进行精确测量(230)。李爱明等探讨了个性化信息检索系统中用户模型的相关问题,认为用户模型的引入和检索函数的利用可提高系统检索效率(231)。于春等从用户角度研究相关性理论,力图证明存在一个核心的、可以跨不同用户类型、问题情境和信息源环境的关于信息用户在信息需求检索中的相关性判断的因素集(232)。裴雷从行为发现、行为认知和相关反馈三个层面,针对用户信息素质差异、检索系统功能差异和检索社会文化背景差异提出用户交互的影响因素(233)

3.4.3 用户检索行为多学科的理论探讨

对用户检索行为多学科的理论探讨领域,可以帮助研究者从多角度考察影响用户信息检索效果和满意度的相关因素。Xu从动态理论的角度讨论用户的信息查询行为,认为现在研究的难点是潜在的控制信息查询行为动态性的机制还不清楚,阻碍了对用户查询行为动态性的把握(234)。Zhang从心理学角度研究用户使用网络检索的心理模式,并将学生的心理模式分为获取信息的主要途径、理解搜索引擎工作的原理、检索策略3个方面。研究结果显示通过个人观察、与他人交流以及课堂培训可以有效地构建用户心理模式(235)。Amanda从认识论的角度,研究用户在信息检索过程中产生的认知跳跃,即由外力造成的思想变化。通过实证研究发现,认知跳跃普遍存在,用户的认知跳跃主要存在信息问题和信息查找阶段(236)

3.4.4 用户信息检索行为的实证研究

用户信息检索行为的实证研究主要为获取用户对信息资源、检索工具、检索习惯的认识,从而帮助信息检索系统各检索功能的完善。

赖茂生、屈鹏对网络信息检索中的用户行为进行了系统研究,涉及网络用户的查询与点击行为(237)、网络用户搜索语言使用行为(238)、用户自然和社会属性对网络搜索中语言使用行为的影响(239)、网络用户信息获取语言使用行为(240)、大学生信息检索能力(241)等方面;并得出一些较为新颖的结论:①用户构造检索式主要依赖自然语言句法和精确检索;②影响用户点击网页的主要因素为标题、摘要来源,排序则基本不起作用;③搜索时间越长,用户体验的满足感就越低;④专业教育因素对用户的语言使用行为有强烈的影响;⑤标签和标记行为已经在Web 2.0用户中产生了很大的影响;⑥对于系统提供的相关词而言,普通用户对其满意度很高,但是利用度较低;⑦本科生主要使用搜索引擎查找信息,且认为搜索引擎的适用性高于数据库和OPAC。顾立平通过调查总结了用户在Web 2.0交互式环境中,以非线性、非单一、非大众的方式搜索信息,并提出了16项优化与4个应用途径的建议(242)。Anwarul调查了印度大学图书馆用户在网络环境下的信息检索行为,发现用户认为数字资源可以取代传统图书馆,用户不必再去图书馆;仅有一个大学认为传统图书馆和纸质资源比网络资源对用户的作用更大(243)。Habibi通过对阿尔达比医学院的教师利用网络信息检索工具以及具体检索行为进行调查分析得知,该校教师大部分使用Yahoo或Google,而且大部分只用简单的关键词检索,而很少使用导航或是高级检索工具及技术提供的主题目录。在选择检索工具时,他们几乎不考虑检索效率,而取决于检索工具的名声及可靠性(244)。Rada通过让医学院学生满足病人信息需求的实证研究探讨检索工具随用户的信息需求不同而异。结果证明,通过万维网来提供信息是非常可行的。如果只是查找一般知识,更倾向于使用网络入口;一些使用自然语言处理的半自动化工具对于缩小文献与现实情况的差距很有帮助。如果想获得一些更专业的知识,则需要专业数据库(245)。John研究用户在构造检索式方面受到资源特性的影响,通过实证研究证明资源的类型对基于任务的信息检索的检索式构成影响不大(246)。Adeline通过对65岁以上的老人进行为期五周的培训,发现其计算机焦虑感下降、计算机信息和自我效能增加,可以通过信息检索获取健康方面的信息。这证明培训对他们的健康、独立、安全有作用(247)

4 关于信息检索应用的研究

4.1 信息检索在图书馆的应用

图书馆信息检索方面的应用和发展,以图书馆提供的各类信息检索服务为核心,围绕检索系统改进、新技术的应用以及检索使用情况调查等方面进行系统研究。

4.1.1 图书馆信息检索系统的完善

图书馆信息检索系统的完善方面,学者主要关注数据库检索功能的改进。Kumbar就图书馆联机检索目录升级,从图书馆目录的可用性、使用频率、使用图解、书目细节的丰富度、书目使用指南和用户教育项目的需求等方面进行调查。结果显示,图书馆员应该和软件专家合作开发出更能满足用户需要的系统。另外,对于电子资源的编目,如CD-ROMs,DVDs的需求十分迫切(248)。Mason对Lexis Professional和Westlaw UK两个在线法律检索工具进行了对比研究(249)。Ahmed对数据库检索界面的设计进行研究,他认为信息检索对于界面设计的关注还不够,在界面设计中需要引入HCI技术,而且这不能只依赖于数据库商的努力。HCI技术对发展用户检索界面非常有帮助,在设计时应该坚持以用户为中心的方式(250)。缪融论述了实现基于外文数据库的交叉语言检索系统的可能性(251)。唐振宇从数据库选取、检索词的确定以及检索结果的优化等方面研究图书馆个性化信息服务跨库检索系统(252)

4.1.2 新检索技术的应用

新型信息检索技术在图书馆应用情况分析,尤其关注整合式检索的发展。Aswani探讨了在数字图书馆中如何开展智能信息检索,提出两种智能检索方式空间向量检索和潜在语义索引,并针对潜在语义检索设计了一个检索模型,通过提问预处理、余弦相似性计算、结果排序和评价等步骤实现智能化检索(253)。Gerhard研究数据库系统与信息检索方式整合,通过近似符合(匹配)和数据相关、对结果进行排序、放宽和异质性架构、信息抽取和不确定数据、实体数据库的检索和排序等工作,对事实知识库进行自动的建立与维护(254)。周彩云研究与开发图书馆集成化信息检索平台(255);许春漫提出了一个基于概念的数字图书馆个性化信息检索模型(256)

4.1.3 图书馆信息检索服务的利用

研究者对图书馆信息检索服务使用情况进行了调查,苏菊等提出一种基于读者借阅信息的科技图书检索结果客观排序算法,以改善读者的查准率(257)。Laura将图书馆信息检索系统改进与信息素养标准之间进行对比,帮助图书馆员了解这些改进措施对信息素养教学的影响(258)。Tamdogan将图书馆作为信息系统,也是信息链的一部分,探讨在信息链中,图书馆、各类检索工具、各类信息中心所发挥的作用(259)。Ian通过实证研究发现,用户对于其在公共图书馆的检索结果的需求上只需大致的分类,所以在检索精确性方面,不需要再为精确的分类而困扰(260)。Anup从检索特征方面,尤其是多语言、多媒体方面,对印度图书馆进行调查评价,发现印度数字图书馆普遍提供南亚文化遗产、信息资源方面的信息检索功能,并为发展中国家发展数字图书馆提供建议(261)。另外,还有学者关注信息检索相关技术在图书馆科技查新服务中的应用,如徐勇探讨了学生搜索引擎在科技查新中的应用(262),梁丽明介绍了Dialog系统在医学科技查新中的应用(263),于世花研究了搜索引擎在科技查新中的作用(264)

4.2 信息检索教育的发展

信息检索教育是国内外信息检索领域研究的重点,国内外学者在此领域的研究视角不同。

4.2.1 国内信息检索教育研究

国内学者以图书馆为主体,对信息检索教育的教学内容、教学方式、教学过程等进行了研究,并出版了一系列信息检索教育指导用书,如葛敬民的《实用网络信息检索》(265)、通识教育规划教材编写组的《信息检索》(266)和潘燕桃的《信息检索通用教程》(267)。①信息检索教学内容的改革,敬卿等从宏观角度探讨了信息检索课重心的调整与改革问题,并提出了超越信息检索,构建面向知识创新的信息素质教育体系的观点(268);王泽琪认为网络环境下信息素质检索课教学内容应体现不同本科专业的特点(269)。②信息检索教学方式的革新方面,孙丽芳介绍了信息检索课协作式教学策略的实施方案(270);华薇娜分析了将个案分析方式引入到信息检索课程教学中的做法和意义(271);回雁雁设计了三个层次的实验教学,即演示性和验证性实验教学、综合性实验教学、创新性实验教学(272)。还有的学者对信息检索教学过程进行研究。何钧对信息检索课程的成绩评定提出适应课程发展的成绩评定方案、考核内容、分值分配比例及考试方法等改革的设想(273)。冯凯提出将神经网络的原理用于信息检索课程多媒体教学质量评价,给出了基于神经网络的信息检索课程多媒体教学质量评价模型结构(274)

4.2.2 国外信息检索教育研究

国外学者则从图书情报学教育的角度进行研究。Esther介绍了信息素质教育在国外发展的状况(275);David对图书情报学教育的核心课程设置进行研究,通过对全欧洲图书情报学教育课程的调查,分析了在信息行为大环境下的信息检索,认为信息检索、知识组织、信息素养应该成为课程中心(276)。Ina讨论了信息素质教育、信息检索、数字鸿沟三者之间的关系,认为数字鸿沟不应仅关注信息技术教育和信息检索;个人承诺、团体合作、来自机构的学术科研支持等都应为知识的形成和交流的组成部分(277)。Jeffrey对搜索引擎、网格、普通计算、非计算机技术、技术应用、普通技术、网站提供等7个领域的教科书进行调查,以便为教师提供更多关于信息检索教科书的信息,同时也为学生提供帮助(278)

4.2.3 网络化教学方式的研究

国内外学者均对网络化、数字教学方式的研究尤为重视。熊鹰介绍了《信息检索与利用》网络课程的整体结构设计、教学内容设计、制作过程、教学应用情况(279)。沈艳红给出了利用WebQuest开展“网络信息的组织与检索”的教学实例(280)。马铭锦提出使用JSP技术建立《电子资源检索与利用》网络教学系统(281)。陈晓瑜介绍了利用Blackboard构建信息检索课远程教学平台的过程(282)。冯凯设计了一个基于Agent的信息检索课教学系统模型(283)。Chutima介绍了远程信息检索教学平台构建的过程,对平台的内容模块和评价工作进行详细解释。其中评价主要分为面向专家的在建评价和面向馆员和用户的建成评价,并提供在线和离线两种评价方式,功能一致,不过离线评价通过CD光盘的形式(284)

4.3 基于文献的新兴趋势探测研究

新兴趋势探测研究(Emerging Trend Detection,ETD)是指发现某个特定领域中热点信息的动态趋势,并在探测到最新发展动态时进行提示的过程,是信息检索和文本挖掘的新兴研究应用方向。新兴趋势的探测研究包括主题的特征表示、主题特征识别与去抽取和主题特征确认与趋势判断三个层次。通过揭示某个特定领域在一定时间内显示出来的研究方向的变化情况,深入挖掘文献集合中包含的时间相关信息,借助计算机技术去主动探测新兴趋势,以提高科研情报人员对科学动态及时把握和处理的能力,有利于研究计划的制定与修改。目前研究较多的是主题的特征表示,通常被表示为与时间、作者和引文相关联的词频、共词和引文。陈仕吉(285)、殷蜀梅(286)概括了新兴研究趋势的技术方法,冯璐分析了共词分析法的理论进展(287),蒋颖利用LISA数据库,对1995—2004年全世界文献计量学领域发表的期刊论文进行共词分析,绘制了1995—1999年和2000—2004年两个时间段的类团关系图和战略坐标图,并分别比较和分析了类团关系图和战略坐标图中相关研究主题的发展变化情况(288)

引文分析方法中的直接引用、同被引和文献耦合是研究的重点。Small利用不同时间片同被引网络的差异来探测研究领域的凸显、发展以及预测研究领域下一个时期可能的发展(289),并尝试用Currency指标来预测研究领域的发展趋势(290)。Chen结合了引文分析和共词方法,在CiteSpaceⅡ中定义了研究前沿和知识基础两个概念,研究前沿与知识基础相互作用并动态发展,CiteSpaceⅡ可以生成由研究前沿词汇(主题词)和知识基础(论文簇)构成的异构网络(291)

直接引文网络已有初步的研究。K lavans和Boyack比较了利用直接引用关系(科学引文网络)和同被引关系(同被引网络)的聚类结果,认为直接引用关系更适合实现相似文献的聚类分析(292)。此外,与同被引网络相比,科学引文网络有可能更直接、更早地揭示科学引文网络所代表的研究领域的结构特征和发展趋势。Naoki等以镓化氮(Gallium Nitride)和复杂网络(Complex Network)两个研究领域为例,利用Newman提出的社团结构探测算法(拓扑聚类算法)对科学引文网络进行聚类分析,分析聚类结果中论文簇的平均年指标和不同时间片的论文簇之间的父子关系以探测研究前沿的凸显(293)。此外,Yoshiyuki等和Yuya也利用该方法探测光学领域的知识结构特征和新兴的研究领域(294)

4.4 关于信息检索其他应用的研究

信息检索的应用范围广泛,其中重点是在地理(295)(296)、医学(297)(298)、社会科学(299)(300)(301)(302)、化学、电子政务(303)(304)(305)等学科的应用。在各学科的具体应用研究中,侧重点也各不相同。TREC2010的信息检索专项任务是关注博客、化学、法律、网络应用等领域(306)

5 总结与展望

5.1 关于信息检索研究主体的分析

纵观近5年信息检索的研究,利用Web of Knowledge和中国知网的结果分析功能和CitespaceⅡ知识图谱分析软件,我们对信息检索研究领域的核心研究国家、核心研究机构、核心作者和核心期刊,以及近5年的研究热点和研究前沿进行统计:国际方面主要的研究国家为美国、西班牙、英国、中国、法国、德国、韩国、日本,发表的文章均超过20篇。主要的研究机构为格拉纳尔大学、格拉斯哥大学、史崔克莱大学、谢菲尔德大学等;核心作者比较分散,文章数量在4~5篇的作者有10人(见表1,表2)。

表1 2006—2010年国外信息检索领域核心研究机构和核心作者

img54

续表

img55

表2 2006—2010年国外信息检索领域的核心期刊

img56

国内方面,信息检索研究主要集中在武汉大学、南京大学、北京大学等国内知名高校中,核心作者的发文量集中在4~6篇,核心期刊则主要集中在图书情报学领域和计算机领域,排名前10位的机构、作者、期刊参见表3和表4。

表3 2006—2010年国内信息检索领域核心研究机构和核心作者

img57

表4 2006—2010年国内信息检索领域的核心期刊

img58

5.2 关于信息检索研究热点的总结

我们利用CitespaceⅡ总结近5年信息检索领域的研究热点,通过Web of Knowledge数据库检索2006—2010年主题包含为“information retrieval”的相关文献,共获得457条记录,将数据输入CitespaceⅡ软件中,网络节点确定为关键词,选择默认阈值运行,生成关键词被引频次大于8次的关键词列表(见表5),统计结果表明,研究热点方面除去信息检索(information retrieval)以外,还包括系统、模式、相关性、设计、检索性能、查询扩展等。

表5 2006—2010年关于信息检索研究的关键词列表(被引频次>8)

img59

5.3 关于信息检索研究趋势的概括

我们利用CitespaceⅡ中提供的膨胀词探测技术,通过考察词频的时间分布,将频次变化率高的词从大量的主题词中探测出来,依靠词频的变动趋势,而不仅仅是频次的高低,来确定信息检索研究的前沿领域和发展趋势。我们通过CitespaceⅡ共获得信息检索研究的活跃研究对象34个,依次为:在线产品搜索引擎、医学成像检索研究、基于内容的3D地理信息检索、耦合测度、医学检索、软计算、检索新能评价、P2P个性化信息检索、XML信息检索、语义网、民族音乐检索、基于统计图的音乐信息检索、自动学习、智能检索、自动排序功能、上下文相关的信息技术系统、多元模型的评价、整合式信息检索、智能告知机制、术语赋值框架、借代识别技术、医药植物检索、依存结构、用户满意度、基于资料的跨语言信息检索、信息检索劳动力理论、活动力理论、基于边际的有效性排序、基于内容的信息检索、相关性理论、查询层次的损失函数、数据聚类、群组假设,如图1所示。根据时间轴显示,2008—2010年的频次变化高的词分别为在线产品搜索引擎、耦合测度、医学检索、检索性能、P2P检索、音乐检索、自动学习、智能检索、排序、用户满意度、基于内容的检索、模糊数据和数据聚类;也说明上述13个方向可以代表信息检索的研究趋势。

img60

图1 信息检索研究前沿与发展趋势知识图谱

同时,笔者还通过2008—2010年召开的ACM SIGIR、TREC和ECIR会议公布研究主题进行补充验证,发现以下新研究趋势:首先是信息检索的推广应用领域将更为宽广,除了应用在数字图书馆、地理科学、医学、专利检索等前文中提到的领域外,在企业信息资源管理、具体学科应用,如化学的分子结构检索、生物医学的基因检索和具体学科知识的垂直检索等都受到日益关注。其次,由于海量网络信息资源存在,分布式信息检索成为信息检索的主要方式之一,实现分布式信息检索的技术研究热点包括P2P技术、检索结果的聚类整合技术等,而且也产生许多新的检索方式,如移动检索、云计算等。再次,社会化网络环境下的信息检索研究也取得显著进步,如社会化标签技术、元数据检索、博客检索、论坛检索等技术得到应用。为了应对由于检准率不高及网络资源泛滥带来的垃圾信息的干扰,对抗性信息检索技术应运而生,以便对于那些出于经济目的,恶意操纵检索工具,在互联网散布搜索引擎的垃圾邮件、广告,并进行恶意标注、逆向排名等行为进行有效的过滤和对抗。最后,信息检索的副产品同样具有重要的研究价值,对信息检索副产品,如检索历史、检索式、检索频率等开发利用,可以挖掘更多与用户相关的信息,有助于信息检索效率。

5.4 信息检索研究中存在的问题

信息检索作为一个多学科交叉研究领域,近五年的研究已取得长足进步,但仍存在一些问题,有待研究者在未来的工作中进一步探讨。

5.4.1 信息检索合作与应用研究有待加强

信息检索研究应该走出实验室,与各类资源服务的提供方合作,面向海量数据、实时处理真实网络环境下存在的挑战,发挥信息组织与管理的技术优势,进一步推广研究成果的应用。如用于商业舆情分析、金融舆情分析、信息协同推荐、用户群组分析的社会计算应用系统;用于个性化搜索、新闻推送、客服聊天机器人、垂直搜索的搜索与推荐应用系统等。信息检索研究还应加强在商业领域的应用。将其应用于企业内部信息资源管理,开发下一代企业内搜索技术,利用信息抽取与文本数据挖掘技术对企业内信息进行组织整理,将组织好的结构化信息提供给企业内用户,以帮助用户更好地搜索、浏览信息。将其应用于电子商务领域则需要关注海量网页和结构化信息的搜索算法技术,通过对分布式计算、存储和搜索引擎平台的研发,建立起高性能的大型分布式基础架构,以处理数以亿计的网页信息,应对每日上亿次查询,并有效地管理成千上万台服务器集群。垂直检索的研究和推广可帮助用户获取专指性强的信息资源,如面向行业的垂直检索和音乐垂直检索的应用等。另外,信息检索应用研究存在滞后性,早在2003年Google的研究者就已经呼吁研究界对大规模数据中的垃圾和有害信息问题进行关注,并将其称为搜索引擎所面临的挑战之一,而直到2006年ACM SIGIR才开始关注此方面研究,而中文垃圾邮件过滤评测是2010年中文Web评测的两个方向之一。

5.4.2 中文信息检索的研究仍很薄弱

随着汉字编码、分词等基本问题的解决,中文信息处理技术取得了长足进展。国内相继召开了多个面向中文信息处理技术的评测会议。但在中文信息评测、跨语言检索等方面还需要进一步的研究。2002年黄昌宁教授曾呼吁“为了推动中文信息处理的发展,让我们拿起评测这个武器,扎扎实实地研究其适用技术,没有统一评测的研究成果,终究不是完全可信的”。虽然国内已经开展针对中文的测试项目,如863评测、全国搜索引擎和网上信息挖掘会议(SEWM)等,但是评测的领域十分有限,仍然集中在文献检索等基本领域,忽视了目前广泛应用的网络检索各领域;同时存在查询条件与文档词汇内容失配;部分命名体、新词以及缩略语识别困难;以及在计算相似度时,查询词汇权重的设定存在偏差等问题。另外关于中文语言处理技术、中文共指消解、汉语依存句法分析、汉语语义角色标注、中文短句和简单句复述技术和中文消歧技术等方面,也还需要深入研究。

5.4.3 加强信息检索用户的研究

2005年,TREC在其总结报告指出,现在“信息检索性能已进入平台期”。这表明,与用户无关的传统信息检索技术已相对成熟。用户研究正成为研究人员关注的重点。通过调查,笔者发现目前的用户研究主要集中在信息检索评价领域,而在其他方面如人机交互、检索系统设计、个性化检索、用户的查询意图分析和用户检索式的理解、用户检索行为等方面的研究不够深入;用户因素尚未完全融入信息检索研究的全过程。用户之于信息检索的重要性不言而喻,在未来的信息检索研究中,我们应该树立“人本研究”的思想:以人为本源,充分研究用户行为和群体智慧,在使用过程中持续地关注用户需求和用户信息行为的细化;以人为本,采取人机协同、人人协同的应用模式;并在知识获取中采取人本计算,让大规模用户自己参与到信息检索研究中来。另外,还需加强对文档和用户信息的可视化表示、自然语言的交互界面以及搜索日志和用户行为的分析的研究,从更深的层次,甚至社会网络等方面来研究更友好的人机交互,并力图使信息检索能够具备从信息交互中进行快速学习的能力。

5.4.4 深化信息检索的评价研究

在信息检索领域,检索系统的评价一直对系统的研究、设计与发展有显著的影响力。评价使得信息检索研究之间的比较更加客观,从而让研究者认清各种技术的优劣,起到正确引导研究发展方向的目的。当信息的来源已不再是问题时,如何快捷准确地获取感兴趣的信息,就成为人们关注的主要问题。不同的搜索引擎系统对于同一个用户查询,返回的结果往往存在差异,由此产生了比较结果的问题。而基于主观使用感受的评价既不客观也不可靠,因此,必须发展出一套客观的评测体系,这种评测不受个别人主观感觉的影响,并且所做出的评价在通常情况下都能成立。在信息检索评价中已形成了一系列指标,如准确率(Precision)、召回率(Recall)、F1值,随着测试集规模的扩大以及人们对评测结果理解的深入,更准确反映系统性能的新评价指标逐渐出现,包括平均准确率(Mean Average Precision,即MAP),R-Precision和P@10。但是如何降低人为因素的影响仍是信息检索评价亟待解决的问题。从TREC来看,现在的任务设置向高精度、细粒度和大规模三个方向倾斜,比较有代表性的有高精度文档检索任务、新信息检测任务、问答任务和TB级检索等。其中前三个任务要求返回的结果不再是简单的一篇篇文档,而是信息片断,而TB级检索则是把测试集的规模提高到了TB级。相对于目前的技术而言,这些任务还是相当困难的,与实用还有一段距离。另外,对于中文信息检索测评,仍处于学习国外的相关评测(尤其是TREC系列会议)的阶段。国内的信息检索评测无论是从数据规模还是从评测手段来看,与国际知名评测项目仍有较大差距,这是由我国目前的科研和应用的总体水平决定的。但差距的存在也表明提升的空间巨大,国内的信息检索研究者任重而道远。

【作者简介】

img61

黄如花,女,1968年生,武汉大学信息管理学院教授,博士生导师,图书馆系副主任,博士。兼任中国图书馆学会图书馆学教育专业委员会副主任、中国图书馆学会编译出版委员会图书馆学文献编译出版专业委员会副主任、《中国图书馆分类法》编委会第七届委员会委员、湖北省图书馆学会学术委员会委员,国际知识组织协会(ISKO)会员、国际期刊International Information and Library Review(IILR)的同行评审专家。主要研究方向为信息检索、信息组织与信息服务。曾主持国家社科基金项目“网络信息组织模式的优化研究”,现主持教育部人文社会科学重点研究基地重大项目“数字信息时代的图书馆管理研究”(07JJD870221)和国家社科基金项目“社会化网络环境下信息组织的理论与方法创新研究”(10BTQ023)。已出版《网络信息组织:模式与评价》、《信息检索(第2版)》和《数字图书馆原理与技术》等著作9部,发表论文80余篇。2007年入选“教育部新世纪优秀人才”。

宋琳琳,女,1984年生,武汉大学信息管理学院2008级博士生。

【注释】

(1)黄如花.近五年国内外信息检索研究述评[C]//肖希明主编.图书馆学研究进展.武汉:武汉大学出版社,2007:319-364.

(2)王知津,蒋伟伟.十五年来我国网络信息检索研究述评[J].情报科学,2004(4):385-389.

(3)王智红,潘晓丽,吴晓鸥.近十年我国网络信息检索研究主题分析[J].情报杂志,2009(7):1-6.

(4)Clare Thornley,ForbesGibb.Meaning in Philosophy and Meaning in Information Retrieval[J].Journal ofDocumentation,2009,65(1):133-150.

(5)Clare Thornley,Forbes Gibb.A Dialectical Approach to Information Retrieval[J].Journal ofDocumentation,2007,63(5):755-764.

(6)Clare Thornley.Dilemmas in Information Science(IS)and Information Retrieval(IR);Recurring Challenges or New Solutions[J].Aslib Proceedings,2009,61(3):323.

(7)张新民,化柏林,罗卫东.认知信息检索研究的发展与展望[J].图书情报工作,2007(10):6-9.

(8)张露,成颖.信息检索中的语境研究综述[J].现代图书情报技术,2009(10):14-21.

(9)Warner Julian.Selection Power and Selection Labor for Information Retrieval[J].Journal of the American Society for Information Science and Technology,2007,58(7):915-992.

(10)Warner Julian.Description and Search Labor for Information Retrieval[J].Journal of theAmerican Society for Information Science and Technology,2007,58(12):1783.

(11)W ilson,T.D..Activity Theory and Information Seeking[EB/OL].[2010-05-28].//ASIST.Annual Review of Information Science and Technology.http://www3.interscience.wiley.com/journal/109861081/toc.

(12)Yunjie Xu.The Dynamics of Interactive Information Retrieval Behavior,Part I:An Activity Theory Perspective[J].Journal of theAmerican Society for Information Science and Technology,2007,58(7):958.

(13)Feldman,D.V..The Geometry of Information Retrieval[J].Choice,2006,43(5):889.

(14)Christopher D.Manning,Prabhakar Raghavan,Hinrich Schute.Introduction to Information Retrieval[M].London:CambridgeUniversity Press,2008.

(15)Amanda Spink,CharlesCole.New Directions in Cognitive Information Retrieval[M].Netherlands:Springer,2006.

(16)Cheng Xiangzhai.Statistical Language Models for Information Retrieval[M].San Rafael:Morgan and Claypool Publishers,2008.

(17)刘海峰,张学仁,刘守生.Web信息检索模型特点与问题综述[J].软件导刊,2009(3):3-6.

(18)王非,何绍华.信息检索交互模型研究[J].图书情报知识,2007(9):84-87.

(19)张小芳.几种常见信息检索模型的分析与评价[J].情报杂志,2008(5):121-123.

(20)吴丽华,张宏斌,罗云锋.信息检索模型及相关性算法的研究[J].情报杂志,2006(12):25-27.

(21)Sandor Dominich,Tamas Kiezer.A Measure Theoretic Approach to Information Retrieval[J].Journal of the American Society for Information Science and Technology,2007,58(8):1108.

(22)Rolleke Thomas,Tsikrika Theodora,Kaza Gabriella.A General Matrix Framework for Modelling:Information Retrieval[J].Information Processing&Management,2006,42(1):14-30.

(23)樊红侠.基于粗糙—模糊集的Web信息检索改进模型[J].现代图书情报技术,2008(8):53-57.

(24)张辉,赵需要.因特网信息检索模式及其优化设想[J].情报科学,2007(1):77-81.

(25)王修力,马利平.文本信息检索的代数模型综述[J].吉林大学学报:信息科学版,2007(9):569-576.

(26)焦玉英,宋晓晴.基于VSM的文档信息检索改进[J].情报理论与实践,2007(1):97-99.

(27)Nottelmann Henrik,Straccia Umberto.Information Retrieval and Machine Learning forProbabilistic SchemaMatching[J].Information Processing&Management,2007,43(3):552-576.

(28)ZhaiChengxiang,Lafferty John.A Risk M inimization Framework for Information Retrieval[J].Information Processing&Management,2006,42(1):31-55.

(29)王成,杨建秀,王铁,王涛.基于本体的面向概念信息检索机制研究[J].情报杂志,2007(11):112-114.

(30)刘斌,陈桦.向量空间模型信息检索技术讨论[J].情报杂志,2006(7):92-94.

(31)方清华.信息检索过程模型的认知分析[J].情报杂志,2007(1): 54-56.

(32)冯兰萍,朱礼军,张继国.一种本体驱动的Web信息检索模型及实现[J].情报学报,2006(3):276-281.

(33)高炜,张超,梁立.信息检索排序算法研究综述[J].信息技术,2009(6):1-4.

(34)余洋.聚类在信息检索领域中的应用研究[J].情报理论与实践,2007(3):405-408.

(35)Sandor Dominich.TheModern Algebra of Information Retrieval[M].New York:Springer Berlin Heidelberg,2010.

(36)陈晓金,王兵.信息检索扩展技术研究[J].图书情报工作,2008(12):88-91.

(37)金玮.Web信息检索技术中关联规则挖掘算法应用研究[J].情报杂志,2007(1):36-42.

(38)Chen Cher Sheng,Chung Chung Ping,Shann Jean Jyh Jiun.Fast Query Evaluation Through Document Identifier Assignment for Inverted File-based Information Retrieval Systems[J].Information Processing&Management,2006,42(3):729-750.

(39)Isabella Peters,WolfgangG.Stock.“Power tags”in Information Retrieval[J].Library HiTech,2010,28(1):81.

(40)戴维民,赵建华,汪东波.网络环境下信息组织的创新与发展:全国第五次情报检索语言发展方向研讨会论文集[C].北京:国家图书馆出版社,2009.

(41)侯汉清.情报检索语言与智能信息处理丛书[C].南京:东南大学出版社,2009.

(42)章成志,苏新宁.面向信息检索的词汇知识发现[J].现代图书情报技术,2007(1):10-14.

(43)章成志,苏新宁.面向信息检索的排除词识别研究[J].现代图书情报技术,2007(2):44-48.

(44)马晖男,吴江宁,潘东华.信息检索中修饰语作用的研究[J].情报学报,2006(3):306-311.

(45)Huinan Ma,JiangningWu,Donghua Pan.Research on the Importance of Modifiers to Document Information Retrieval[J].Journal of the China Society for Scientific and Technical Information,2006,25(3):306-311.

(46)孙巍.一种面向中文信息检索的汉语自动分词方法[J].现代图书情报技术,2006(7):33-37.

(47)吴凡.信息检索中的中文分词问题研究[J].情报杂志,2008(7): 41-43.

(48)孙西全,马瑞芳,李燕灵.基于Lucene的信息检索的研究与应用[J].情报理论与实践,2006(1):125-128.

(49)李育嫦.词表在网络信息检索中的应用分析[J].情报理论与实践,2006(2):161-163.

(50)Khaltar Badam,FujiiAtsushi.A Lemmatization Method for Mongolian and Its Application to Indexing for Information Retrieval[J].Information Processing and Management,2009,45(4):438-451.

(51)Broughton Vanda.The Need for a Faceted Classification as the Basis ofA ll Methods of Information Retrieval[C].Aslib Proceedings,2006,58(1):49-72.

(52)赵丹群.试论信息检索系统的后控制机制[J].图书情报工作,2007(1):60-63.

(53)AresenaultClement.The Use of Index Languages for Information Retrieval[J].Documentation etBibliotheques,2006,52(2):139-148.

(54)何绍华.基于语义网的网络信息检索相关性研究[J].情报杂志,2007(12):120-123.

(55)Chen Cher Sheng,Shann Jean Jyh Jiun,Chung Chung Ping.Unique-order Interpolative Coding for Fast Querying and Space-efficient Indexing in Information RetrievalSystems[J].Information Processing&Management,2006,42(2): 407-428.

(56)CumminsRonan,O'riordan Colm.Evolved Term-weighting Schemes in Information Retrieval:An Analysis of the Solution Space[J].Artificial Intelligence Review,2006,26(1-2):35-47.

(57)Kastner Itamar.Developments in Information Retrieval:Part 1[J].Library&Information Update,2009:17-19.

(58)王灿辉,张敏,马少平.自然语言处理在信息检索中的应用综述[J].中文信息学报,2007(3):35-45.

(59)Gianian Piero Zarri.Ontologies and Reasoning Techniques for(Legal)Intelligent Information Retrieval Systems[J].Artificial Intelligence and Law,2007,15(3):251.

(60)Jiangping Chen.English-Chinese Cross-language Information Retrieval[J].Journal of theAmerican Society for Information Science and Technology,2006,57(2):233.

(61)鲁远.XML信息检索中结构相似度计算[J].情报杂志,2007(11):109-111.

(62)龙泉,陆伟.基于XML的多媒体信息检索[J].情报杂志,2007(10):48-50.

(63)陆伟,夏立新.基于OKAPI的XML信息检索实现研究[J].中国图书馆学报,2006(4):60-64.

(64)夏立新,王忠义.基于XML的全文检索原型系统的设计与实现[J].现代图书情报技术,2007(8):67-70.

(65)廖述梅,万常选,徐升华.XML信息检索探究[J].情报学报,2006(2):229-234.

(66)陆伟,陆娜.INEX 2005 DagstuhlXML信息检索国际会议[J].图书情报知识,2007(1):79-82.

(67)陈军莲.网络信息检索中存在的问题及对策[J].图书馆,2007(5):125-126.

(68)沈建人.改善信息检索效果的途径[J].情报杂志,2006(4): 102-104.

(69)Macfarlane,Tuson.LocalSearch:A Guide for the Information RetrievalPractitioner[J].Information Processing and Management,2009,45(1):159-174.

(70)Ronald N.Kostoff.Expanded Information Retrieval Using Full-text Searching[J].Journal of Information Science,2010,36(3):104.

(71)Hyuk-Jin Lee,GheorgheMuresan.MediatedWeb Information Retrieval for A Complex Searching Task[J].Journal of theAmerican Society for Information Science and Technology,2009,60(7):1372.

(72)Stacey A lison,Stacy Adrian.Effective Information Retrieval from the Internet:An Advanced User'sGuide[M].New York:Neal-Schuman Publishers,2004.

(73)Laura Leist.Increase Productivity and Decrease Costs Implement Information Retrieval Systems[J].CostEngineering,2006,48(9):22.

(74)Lu Jianjiang,Kang Dazhou,Zhang Yafei,Li Yanhui.Approximate Information Retrieval Based on Multielement Bounds[J].Knowledge-Based Systems,2008,21(2):123-139.

(75)Fabio Simeoni,MuratYakici,Steve Neely,Fabio Crestani.Metadata Harvesting for Content-based Distributed Information Retrieval[J].Journal of the American Society for Information Science and Technology,2008,59(1):12.

(76)雷雪.分布式检索中信息集选择方法研究综述[J].情报科学,2008(2):316-320.

(77)张卫,杨晓江.基于P C机群的分布式信息检索系统[J].情报杂志,2006(12):39-41.

(78)韩毅.P2P网络信息检索的研究进展[J].现代图书情报技术,2007(7):36-40.

(79)赵悦,陈凌晖.基于P2P技术的信息检索[J].情报理论与实践,2007(6):847-850.

(80)Rosenfeld Avi,Goldman Claudia V.,Kaminka Gal A.,K raus Sarit.PH IRST:A Distributed Architecture for P2P Information Retrieval[J].Information Systems,2009(2):290-303.

(81)刘洪涛,丰江帆.基于本体匹配的语义对等网络信息检索[J].情报杂志,2008(6):9-12.

(82)陈磊,姜薇,王溢策,黄运涛.对等网络信息检索中的信任问题综述[J].网络通信及安全,2008(15):1016-1017.

(83)焦玉英.异构分布式信息检索系统整合研究[J].中国图书馆学报,2008(2):51-55.

(84)王翠萍,窦玉萌.基于信息整合的网络信息检索系统研究[J].情报学报,2006(6):821-826.

(85)Ying Xie,Vijay V.Raghvan.Language-modeling Kernel Based Approach for Information Retrieval[J].Journal of the American Society for Information Science and Technology,2007,58(14):2353.

(86)Ma Qiang,Nadamoto Akiyo,Tanaka Katsumi.Comp lementary Information Retrieval forCross-mediaNewsContent[J].Information Systems,2006,31(7): 659-678.

(87)吴丹,王惠临.本体在跨语言信息检索中的应用机制研究[J].图书情报工作,2006(9):10-13.

(88)M ingbao Zhang,JingMa.A Semantics-based Information RetrievalMethod[J].Journalof theChina Society forScientific and Technical Information,2009,28(4):509-515.

(89)Giuseppe Pirro,Domenico Talia.LOM:A Linguistic Ontology Matcher Based on Information Retrieval[J].Journal of Information Science,2008,34(6):845.

(90)Silvia Calegari,Elie Sanchez.Object-fuzzy Concept Network:An Enrichment ofOntologies in Semantic Information Retrieval[J].Journal of the American Society for Information Science and Technology,2008,59(13):2171.

(91)王兰成,曾琼,陈雪强,王京.本体论方法在文献型信息检索系统中的应用研究[J].现代图书情报技术,2007(1):15-19.

(92)杨建林.基于本体的文本信息检索研究[J].情报理论与实践,2006(5):601-605.

(93)Papadakis Ioannis,KyprianosKonstantinos,MavropodiRosa,Stefanidakis M ichalis.Subject-based Information Retrieval within Digital Libraries Employing Lcshs[J].D-LibMagazine,2009,15(9):10.

(94)Saravanan,M.,Ravindran,B.,Raman,S..Improving Legal Information RetrievalUsing an Ontological Framework[J].Artificial Intelligence and Law,2009,17(2):101.

(95)张新兴,谈大军.2000—2006年我国基于本体的信息检索研究论文定量分析[J].情报科学,2008(7):1016-1021.

(96)Kishida Kazuak.Technical Issues of Cross-language Information Retrieval: a Review[J].Information Processing&Management,2005,41(3):433-455.

(97)杨丽.国外跨语言信息检索的技术研究综述[J].情报杂志,2008(7):37-40.

(98)张素芳.国外跨语言信息检索中的翻译歧义性问题研究综述[J].图书馆学研究,2006(6):72-78.

(99)吴丹.跨语言信息检索查询翻译消歧方法[J].图书情报工作,2009(13):120-123.

(100)Jian-Yun Nie,Graeme H irst.Cross-language Information Retrieval[M].San Rafael:Morgan and Claypool Publishers,2010.

(101)Kishida Kazuaki.Term Disambiguation Techniques Based on Target DocumentCollection for Cross-language Information Retrieval:An Empirical Comparison of Performance Between Techniques[J].Information Processing&Management,2007,43(1):103-120.

(102)Kishida Kazuaki,Emi Ishita.Translation Disambiguation for Cross-language Information RetrievalUsing Context-based Translation Probability[J].Journal of Information Science,2009,35(4):481.

(103)吴丹.本体驱动的跨语言信息检索研究[J].现代图书情报技术,2006(5):22-26.

(104)Tuomas Talvensaari,Jorma Laurikkala,Kalervo J-rvelin,Martti Juhola,Heikki Keskustalo.Creating and Exploiting aComparableCorpus in Cross-language Information Retrieval[J].ACM Transactions on Information Systems,2007,25(1):4.

(105)Talvensaari Tuomas,Laurikkala Jorma,Jarvelin Kalervo,Juhola Martti.A Study on Automatic Creation of aComparableDocumentCollection in Cross-language Information Retrieval[J].Journal ofDocumentation,2006,62(3):372-387.

(106)Tuomas Talvensaari,Martti Juhola,Jorma Laurikkala,Kalervo J-rvelin.Corpus-based Cross-language Information Retrieval in Retrieval of H ighly RelevantDocuments[J].Journal of the American Society for Information Science and Technology,2007,58(3):322.

(107)AbdeighaniBellaachia,Ghita amor-Tijani.Proper Nouns in English-arabic Cross Language Information Retrieval[J].Journal of theAmerican Society for Information Science and Technology,2008,59(12):1925.

(108)Mayr Philipp,Petras Vivien.Cross-concordances:Terminology Mapping and Its Effectiveness for Information Retrieval[J].International Cataloguing and Bibliographic Control,2009,38(3):43-52.

(109)LiQing,Chen Yuanzhu Peter,Myaeng Sung Hyon,Jin Yun,Kang Bo Yeong.ConceptUnification of Terms in Different Languages ViaWeb M ining for Information Retrieval[J].Information Processing and Management,2009,45(2): 246-262.

(110)Cosijn Erica.Developing a Morphological Normaliser for A frikaans for Use in Cross Language Information Retrieval[J].Mousaion,2007,25(2):21-36.

(111)赵欣,邓明星.基于Web的跨语言信息检索研究综述[J].计算机与现代化,2009(2):36-39.

(112)Daumke Philipp,Marku Kornel,Poprat Michael,Schulz Stefan,K lar Rudiger.Biomedical Information Retrieval across Languages[J].Medical Informatics&The Internet in Medicine,2007,32(2):131-147.

(113)Oh Jong Hoon,Choi Key Sun.An Ensemble of Transliteration Models for Information Retrieval[J].Information Processing&Management,2006,42(4): 980-1002.

(114)Youakim Badr,Richard Chbeir,A jith Abraham,Aboul-Ella Hassanien.Emergent Web Intelligence:Advanced Semantic Technologies[M].New York:Springer,2010.

(115)柳巧玲,米天胜.基于语义网的智能信息检索研究[J].科技管理研究,2008(8):160-162.

(116)李鹏,乔晓东,张用军,赵新力.Ontology与CBR集成的Web智能信息检索研究[J].现代图书情报技术,2006(12):34-36.

(117)Kumar C.Aswani,Gupta Ankush,Batool Mahmooda,Trehan Shagun.LatentSemantic Indexing-based Intelligent Information RetrievalSystem for Digital Libraries[J].Journal of Computing and Information Technology,2006,14(3):191-196.

(118)赵天忠,张亚非,苗壮,周波,陆建江.基于语义的智能多媒体信息检索技术研究[J].情报科学,2007(3):422-425.

(119)黄崇本,程光华,龚松杰.一种基于R D F数据空间的智能信息检索系统架构[J].情报杂志,2007(12):127-129.

(120)章成志,苏新宁.基于知识空间的智能信息检索模型研究[J].现代图书情报技术,2006(12):29-33.

(121)王艳,张帆.基于Web挖掘技术的信息检索系统设计与实现[J].情报学报,2006(3):339-343.

(122)BhatiaM.P.S.,Khalid Akshi Kumar.Information Retrieval and Machine Learning:Supporting Technologies for Web M ining Research and Practice[J].Webology,2008,5(2):23.

(123)Cummins Ronan,O'Riordan Colm.An Axiomatic Comparison of Learned Term-weighting Schemes in Information Retrieval:Clarifications and Extensions[J].Artificial IntelligenceReview,2008,28(1):51-68.

(124)Nottelmann Henrik,Straccia Umberto.Information Retrieval and Machine Learning forProbabilistic SchemaMatching[J].Information Processing&Management,2007,43(3):552-576.

(125)Dhanapal,R..An Intelligent Information Retrieval Agent[J].Knowledge-Based Systems,2008,21(6):466-470.

(126)邢国春,赵胜文,徐建民.多智能Agent协作在Web信息检索中的应用[J].情报科学,2008(10):1550-1553.

(127)Mehrad,J.,Koleini,S..Using SOM NeuralNetwork in Text Information Retrieval[J].Iranian Journalof Information Scienceand Technology,2007,5(1):56.

(128)Yu-Jin Zhang.Semantic-based Visual Information Retrieval[M].Hershey:IGIG lobal,2007.

(129)Sara Pérezlvarez.An Approach to the Study ofCbir Information Retrieval Systems from the Standpoint of Information Science[J].Documentación de las Ciencias de la Información,2006,29:301.

(130)Christopher Kent,Koen Lamberts.Modeling the Time Course of Feature Perception and Feature Information Retrieval[J].Journal of Memory and Language,2006,55(4):553.

(131)Heting Chu.Information Representation and Retrieval in the Digital Age[M].New Jersey.Information Today,2010.

(132)Colvin Jenny.Naming that Tune:Mobile Music Information Retrieval Systems[J].Music Reference ServicesQuarterly,2009,12(1-2):29-32.

(133)李静.基于内容的视觉信息检索系统比较研究[J].图书馆杂志,2008(7):28-32.

(134)ShiKuo Chang,LeiZhao,ShenodaGuirguis,RohitKulkarni.A Computationoriented Multimedia Data Streams Model for Content-based Information Retrieval[J].Multimedia Tools and Applications,2010,46(2-3):399.

(135)Stefanie Schm idt,Wolfgang G.Stock.Collective Indexing of Emotions in Images:A Study in Emotional Information Retrieval[J].Journal of theAmerican Society for Information Science and Technology,2009,60(5):863.

(136)Martin Valdivia M.T,Diaz Galiano M.C.,Montejo Raez A.,U rena Lopez L A.Using Information Gain to Improve Multi-modal Information Retrieval Systems[J].Information Processing and M anagement,2008,44(3):1146-1158.

(137)李智霞,李元臣.基于特征的图像视频信息检索研究[J].情报杂志,2007(6):117-119.

(138)周宁,刘玮.可视化语音信息检索模型研究[J].现代图书情报技术,2006(2):46-49.

(139)Koshman Sherry.V isualization-based Information Retrieval on the Web[J].Library and Information ScienceResearch,2006,28(2):192-207.

(140)Matthew Cooper,Jonathan Foote,Elias Pampalk,George Tzanetakis.Visualization in Audio-based Music Information Retrieval[J].Computer M usic Journa,2006,30(2):42.

(141)Ruwan Gamage,Hui Dong.JavaScript Tools for Online Information Retrieval[J].Online Information Review,2006,30(4):380.

(142)Gilles Hubert,JosianeMothe.An Adaptable Search Engine forMultimodal Information Retrieval[J].Journal of the American Society for Information Science and Technology,2009,60(8):1625.

(143)Yongping Du,Changqing Yao.Research on Query Optimization Technique in Question-answering Information Retrieval[J].Journal of the China Society for Scientific and Technical Information,2009,28(5):679-684.

(144)David Carmel,Elad Yom-Tov.Estimating theQuery Difficulty for Information Retrieval[M].San Rafael:Morgan and Claypool,2010.

(145)Yiqun Liu,Min Zhang,RongweiCen,Liyun Ru,ShaopingMa.Data Cleansing forWeb Information Retrieval Using Query Independent Features[J].Journal of theAmerican Society for Information Science and Technology,2007,58(12):1884.

(146)吴哲欣.SEO教程:搜索引擎入门与进阶[M].北京:人民邮电出版社,2008.

(147)JenniferGrappone,Gradiva Couzin著.搜索引擎优化[M].杨明军,译.北京:清华大学出版社,2007.

(148)Rebecca Lieb.The Truth about Search Engine Optimization[M].New Jersey:FT Press,2009.

(149)Samuel Blankson.Seo How to OptimizeYourWebsite for InternetSearch Engines[M].London:B landkson Enterprises Limited,2008.

(150)David V iney.Get to theTop on Google:Tipsand Techniques toGetYourSite to theTop ofSearch EnginesRankings and Stay There[M].London:NicholasBrealey Publishing,2008.

(151)Jaimie Sirovich,Cristian Darie.Professional Search Engine Optimization with Php:A Developer'sGuide to Seo[M].Hoboken:W iley/W rox,2007.

(152)Heather J.Lovely.TheBestDamn GoogleSeo Book:Search EngineOptimization Techniques thatwill Increase Your Search EngineRanking[M].On Demand Publishing,2009.

(153)Kristopher B.Jones.Search EngineOptimization:Your Visual Blueprint for Effective InternetMarketing[M].Hoboken:JohnW iley&Sons,2008.

(154)Jon Rognerud.UltimateGuide toSearch EngineOptimization:DriveTraffic,BoostConversion Rates and Make Lots ofMoney[M].Entrepreneur Press,2008.

(155)Stefan Büttcher,Charles Clarke,Gordon Cormack.Information Retrieval: Implementing and Evaluating Search Engines[M].Cambridge:The M IT Press,2010.

(156)左国超.基于属性测度的Internet搜索引擎评价系统研究[J].情报学报,2007(2):235-239.

(157)朱庆华,杜佳.搜索引擎评价指标体系的建立与应用[J].情报学报,2007(10):684-690.

(158)马费成,望俊成,吴克文,邱璇.国外搜索引擎检索效能研究述评[J].中国图书馆学报,2009(4):72-79.

(159)Amanda Spink,Charles Cole.New Directions in Cognitive Information Retrieval[M].Netherlands:Springer,2005.

(160)Ruthven Ian.Interactive Information Retrieval[G/OL]//ASIST Annual Review of Information Science and Technology.[2010-05-29].http://www3.interscience.wiley.com/journal/109861081/toc.

(161)Bai Jing,Nie Jianyun.Adapting Information Retrieval to Query Contexts[J].Information Processing and Management,2008,44(6):1901-1922.

(162)Rieh Soo Young,Xie Hong Iris.Analysis ofMultiple Query Reformulations on theWeb:the Interactive Information RetrievalContext[J].Information Processing&Management,2006,42(3):751-768.

(163)IrisXie.Interactive Information Retrieval in Digital Environments[M].Hershey:IGIGlobal,2008.

(164)高炜,张超,梁立.信息检索排序算法研究综述[J].信息技术,2009(6):1-4.

(165)娄银银,刘春茂.布氏情报学思想对网络信息检索结果的认识优化[J].情报杂志,2008(6):61-63.

(166)Yang Lingpeng,Ji Donghong,Leong Munkew.Document Reranking by Term Distribution and MaximalMarginalRelevance forChinese Information Retrieval[J].Information Processing&Management,2007,43(2):315-326.

(167)Surajit Chaudhuri,Gautam Das,Vagelis Hristidis,Gerhard Weikum.Probabilistic Information RetrievalApproach forRanking ofDatabaseQuery Results[J].ACM Transactions on DatabaseSystems,2006,31(3):56.

(168)张伟,黄奇.基于本体的信息检索系统提高检索结果相关性的研究[J].现代图书情报技术,2007(8):22-25.

(169)A lonso Berrocal Jose L,Garcia Figuerola Carlos,Zazo Rodriguez Angel F..Improvements in the Information Retrieval in theWeb byMeans ofData Processing of the Links[J].SCIRE:Representaciony Organizacion del Conocimiento,2006,12,(1):197-209.

(170)Jing Liu,Ke Yua,Wei Jiang.Research on Search Results Merging Methods in Distributed Information Retrieval[J].Journal of theChina Society for Scientific and Technical Information,2009,28(5):685-688.

(171)Paltoglou Georgios,Salampasis Mchail,SatratzemiMaria.A ResultsMerging A lgorithm for Distributed Information RetrievalEnvironments thatCombinesRegression Methodologieswith a Selective Download Phase[J].Information Processing and Management,2008,44(4):1580-1599.

(172)Martinez Santiago Fernando,Garcia Cumbreras Miguel A.,Urefia Lopez L.Alfonso.Does Pseudo-relevance Feedback Improve Distributed Information Retrieval Systems[J].Information Processing&Management,2006,42(5):1151-1162.

(173)Crestani Fabio.Testing the Cluster Hypothesis in Distributed Information Retrieval[J].Information Processing&Management,2006,42(5):1137-1150.

(174)Claudio Carpineto,Stefano Mizzaro,Giovanni Romano,Matteo Snidero.Mobile Information Retrievalwith Search ResultsClustering:Prototypes and Evaluations[J].Journal of the American Society for Information Science and Technology,2009,60(5):877.

(175)Rebecca L.Mugridge.Information RetrievalDesign:Principles and Options for Information Description,Organization,Display and Access in Information RetrievalDatabases,Digital Libraries,Catalogs,and Indexes[J].Library Resources&Technical Services,2006,50,(1):73.

(176)Pablo J.Garces,Jose A.Olivas,Francisco P.Romero.Concept-matching Systems VersusWord-matching Information RetrievalSystems:Considering Fuzzy Interrelations for IndexingWeb Pages[J].Journal of the American Society for Information Science and Technology,2006,57(4):564.

(177)Ling Jonathan,Van Schaik Paul.The Influence of Font Type and Line Length on VisualSearch and Information Retrieval inWeb Pages[J].International Journal ofHuman-Computer Studies,2006,64(5):395-404.

(178)Karanikolas Nikitas N..Low Cost,Cross-language and Cross-platform Information Retrieval and Documentation Tools[J].Journal of Computing and Information Technology,2007,15(1):71-84.

(179)Wu Shengli,Mcclean Sally.Performance Prediction of Data Fusion for Information Retrieval[J].Information Processing&Management,2006,42(4): 899-915.

(180)Yang,P.,Chuah,M..Performance Evaluations of Data-centric Information Retrieval Schemes for DTNs[J].Computer Networks,2009,53(4):541-555.

(181)Wu Richard S.L.,Wong Allan K.Y.,Dillon Tharam S..E-MACSC:A NovelDynamic Cache Tuning Technique to Reduce Information Retrieval Roundtrip Time over the Internet[J].Computer Communications,2006,29(8):1094-1109.

(182)Liang Chen,Jia Zeng,NaoyukiTokuda.A“Stereo”Document Representation for Textual Information Retrieval[J].Journal of theAmerican Society for Information Science and Technology,2006,57(6):768.

(183)Voorhees Ellen M..On TestCollections for Adaptive Information Retrieval[J].Information Processing and Management,2008,44(6):1879-1885.

(184)Pirkola An.Extracting Variant Forms of Chemical Names for Information Retrieval[J].Information Research,2008,13(3):56.

(185)Kumaran Giridhar,A llan James.Adapting Information Retrieval Systems to UserQueries[J].Information Processing and Management,2008,44(6):1838-1862.

(186)Na Seung Hoon,Kang In Su,Lee Jong Hyeok.Parsimonious Translation Models for Information Retrieval[J].Information Processing&Management,2007,43(1):121-145.

(187)Wu Shengli,Bi Yaxin,Zeng X iaoqin,Han Lixin.Assigning Appropriate Weights for the Linear Combination Data Fusion Method in Information Retrieval[J].Information Processing and Management,2006,45:413-426.

(188)Lioma,C.,Ounis,I..A Syntactically-based Query Reformulation Technique for Information Retrieval[J].Information Processing and Management,2008,44(1):143-162.

(189)Denys Poshyvanyk,Yann-GaelGueheneuc,AndrianMarcus,Giuliano Antoniol,Vaclav Rajlich.Feature Location Using Probabilistic Ranking of Methods Based on Execution Scenarios and Information Retrieval[J].IEEE Transactions on Software Engineering,2007,33(6):420.

(190)Tseng Chris,Ng Patrick.Precisiated Information Retrieval for Rss Feeds[J].Information Management and Computer Security,2007,15(3):184-200.

(191)Saarikoski Jyri,Laurikkala Jorma,Jarvelin Kalervo,Juhola Martti.A Study of the Use of Self-organising Maps in Information Retrieval[J].Journal of Documentation,2009,65(2):304-322.

(192)Kettunen K immo.Reductive and Generative Approaches to Management of Morphological Variation ofKeywords in Monolingual Information Retrieval:An Overview[J].Journal ofDocumentation,2009,65(2):267-290.

(193)Josep Domingo Ferrer,Agusti Solanas,Jordi Castell1 Roca. H(K)-Priv-ate Information Retrieval from Privacy-uncooperative Queryable Databases[J].Online Information Review,2009,33(4):720.

(194)Singh R.K.Joteen.A Robust Information Retrieval Technique for A Bibliographical Database[J].Annals of Library and Information Studies,2008,55(2):135-140.

(195)Voorhees Ellen M..Trec:Continuing Information Retrieval's Tradition of Experimentation[J].Communications of theACM,2007,50(11):51.

(196)Voorhees Ellen M.,Harman Donna K..Trec—Experiment and Evaluation in Information Retrieval[J].Information Processing&Management,2007,43,(1):285-287.

(197)ThomasMandl.Current Developments in Information Retrieval Evaluation[J].LectureNotes in Computer Science,2010,5478:806-809.

(198)Tefko Saracevic.Relevance in Information Retrieval[M].San Rafael: Morgan&ClaypoolPublishers,2010.

(199)Tefko Saracevic.Information Retrieval Test Results:A H istorical Perspective[J].Library Trends,2008,56(4):763.

(200)Schatz Steven.Improving Performance SupportSystems Through Information Retrieval Evaluation[J].Journal of Interactive Learning Research,2006,17(4):58.

(201)SakaiTetsuya.On the Reliability of Information RetrievalMetrics Based on Graded Relevance[J].Information Processing&Management,2007,43(2): 531-548.

(202)韩毅,邓小昭,刘丽,潘幼乔.信息检索领域相关定义的演化及其启示[J].情报理论与实践,2006(3):270-273.

(203)庞弘燊,徐文贤.近年来国外信息检索的相关性研究进展[J].中国图书馆学报,2008(4):88-94.

(204)成颖,孙建军,李宝强.基于关联理论的信息检索相关性研究——信息生产、标引[J].情报科学,2010(1):14-21.

(205)郝斌.本体信息检索情境下相关性理论研究[J].图书情报知识,2007(6):67-71.

(206)Yunjie Xu,Hainan Yin.Novelty and Topicality in Interactive Information Retrieval[J].Journalof theAmerican Society for Information Scienceand Technology,2008,59(2):201.

(207)程娟.基于用户信息检索相关性反馈模型的研究[J].图书馆杂志,2008(4):52-55.

(208)Cosijn Erica,Bothma Theo.Contexts ofRelevance for Information Retrieval System Design[J].South African Journal of Libraries and Information Science,2006,72,(1):27-34.

(209)Krichel Thomas.Information Retrieval Performance Measures for a Current Awareness Report Composition Aid[J].Information Processing&Management,2007,43(4):1030-1043.

(210)成颖,孙建军,李宝强.基于关联理论的信息检索相关性研究[J].情报科学,2010(2):176-181.

(211)李树青,崔慧智.Web信息检索系统中的网页质量分析方法评价[J].情报科学,2008(5):729-734.

(212)王启云.网络信息检索效果指标体系设计探讨[J].图书馆杂志,2006(11):20-22.

(213)Wang Ye Diana,Forgionne Guisseppi.A Decision-theoretic Approach to theEvaluation of Information RetrievalSystems[J].Information Processing&Management,2006,42(4):863-874.

(214)Wang Ye Diana,Forgionne Guisseppi.Testing a Decision-theoretic Approach to the Evaluation of Information Retrieval Systems[J].Journal of Information Science,2008,34(6):861.

(215)Saboori,F.,Bashiri,H.,Oroumchian,F..Assessment of Query Reweighing,by Rocchio Method in Farsi Information Retrieval[J].International Journal of Information Science and Technology,2008,6(1):9-16.

(216)SakaiTetsuya.On the Reliability of Information RetrievalMetrics Based on Graded Relevance[J].Information Processing&Management,2007,43,(2): 531-548.

(217)Zabed Ahmed,Mcknigh Cliff,Oppenheim Charles.The Use of a Heuristic Process to Evaluate an Online Information Retrieval Interface[J].Library and Information Research,2006,30(95):3-9.

(218)Zabed Ahmed.A Comparison of Usability Techniques for Evaluating Information Retrieval System Interfaces[J].Performance Measurement and Metrics,2008,9(1):48-58.

(219)Nuray Rabia,Can Fazli.Information Processing and Management[J].Information Processing&Management,2006,42(3):595-614.

(220)Gabel Jeff.Improving Information Retrieval of Subjects Through Citationanalysis[J].KnowledgeOrganization,2006,33(2):86-95.

(221)邹永利,王春强.影响网络信息检索效率的用户因素[J].情报理论与实践,2008(3):374-376.

(222)Zabed Ahmed,Mcknigh Cliff,Oppenheim Charles.The Use of a Heuristic Process to Evaluate an Online Information Retrieval Interface[J].Library and Information Research,2006,30(95):3-9.

(223)Keshavarz Hamid.Human Information Behaviour and Design,Development and Evaluation of Information Retrieval Systems[J].Electronic Library and Information Systems,2008,42(4):391-401.

(224)RyanW.White,Ian Ruthven.A Study of Interface SupportMechanisms for Interactive Information Retrieval[J].Journal of the American Society for Information Science and Technology,2006,57(7):933.

(225)PetrelliDaniela.On the Role of User-centred Evaluation in the Advancement of Interactive Information Retrieval[J].Information Processing and Management,2008,44(1):22-38.

(226)White Ryen,Jose Joemon,Ruthven Ian.An Implicit Feedback Approach for Interactive Information Retrieval[J].Information Processing&Management,2006,42(1):Jan.166-190.

(227)Smullen M ichael,O'Riordan Colm.An Attempt to Enhance Performance in User Session Based Information Retrieval[J].Artificial IntelligenceReview,2008,26(1-2):11-21.

(228)Yi Kwan,Beheshti Jamshid,Cole Charles,Leide John E.,Large Andrew.User Search Behavior of Domain-specific Information Retrieval Systems:An Analysis of the Query Logs from Psycinfo and Abc-clio's H istorical Abstracts/America:H istory and Life[J].Journal of the American Society for Information Science and Technology,2006,57(9):1208-1220.

(229)Philip H ider.Search Goal Revision in Models of Information Retrieval[J].Journal of Information Science,2006,32(4):352.

(230)Piwowarski,B.,Gallinari,P.,Dupret,G..Precision Recall with User Modeling(Prum);Application to Structured Information Retrieval[J].ACM Transactions on Information Systems,2007,25(1):1.

(231)李爱明,刘冰.个性化信息检索系统的用户模型研究[J].情报杂志,2007(7):121-123.

(232)于春,彭爱东,王波,冯林,田川川,许正平,刘朋娜.信息用户对信息检索相关性判断的因素分析[J].图书情报工作,2009(3):103-107.

(233)裴雷.信息检索过程中的用户交互行为及其影响因素[J].图书情报工作,2007(8):42-44.

(234)Yunjie Xu.The Dynamics of Interactive Information Retrieval Behavior,Part I:an Activity Theory Perspective[J].Journal of the American Society for Information Science and Technology,2007,58(7):958.

(235)Yan Zhang.Undergraduate Students'MentalModels of theWeb as an Information Retrieval System[J].Journal of the American Society for Information Science and Technology,2008,5(13):2087.

(236)Amanda Spink,CherylDee.Cognitive ShiftsRelated to Interactive Information Retrieval[J].Online Information Review,2007,31(6):845.

(237)赖茂生,屈鹏.网络用户的查询与点击行为研究[J].情报理论与实践,2009(3):85-88.

(238)赖茂生,屈鹏,李璐,张丽丽.网络用户搜索的语言使用行为研究——实验设计与搜索价值[J].情报理论与实践,2009(2):95-98.

(239)赖茂生,屈鹏.用户自然和社会属性对网络搜索中语言使用行为的影响[J].现代图书情报技术,2008(7):54-60.

(240)赖茂生,屈鹏.网络用户信息获取语言使用行为[J].现代图书情报技术,2008(6):16-23.

(241)赖茂生,屈鹏.大学生信息检索能力调查分析[J].大学图书馆学报.2010(1):96-104.

(242)顾立平.Web 2.0环境中的学术信息检索行为[J].图书情报知识,2008(6):69-74.

(243)Anwarul Islam,Panda,K.C..Web-based Information RetrievalTrends of Researchers;aCase Study ofSambalpurUniversity(India)[J].TheElectronic Library,2007,25(6):757.

(244)HabibiShafi.Survey of the PresentStatus ofApplication of Information Retrieval Tools and Web Search Strategies by the Academic Members of A rdebil University of Medical Sciences[J].Library and Information Studies,2007,18(1):205.

(245)Rada Roy.Information Retrieval for Online Patient Groups[J].Health Information and Libraries Journal,2006,23(1):60-65.

(246)John E.Leide,Charles Cole,Jamshid Beheshti,Andrew Large,Yang Lin.Task-based Information Retrieval:Structuring Undergraduate H istory Essays for BetterCourse Evaluation Using Essay-type V isualizations[J].Journal of theAmerican Society for Information Science and Technology,2007,58(9):1227.

(247)Chu Adeline.Huber Jeffrey,MastelSmith Beth,Cesario Sandra.“Partnering with Seniors for Better Health”:Computer Use and Internet Health Information RetrievalAmongO lder Adults in a Low Socioeconomic Community[J].Journal of theMedical Library Association,2009,97(1):12-20.

(248)KumbarMallaiah.Changing Pattern ofUser ExpectationsRegarding the Library Catalogue as an Information RetrievalTool:A Case Study ofMangaloreUniversity[J].Annals of Library and Information Studies,2008,55(1):7-16.

(249)Mason Dean.Legal Information Retrieval Study—lexis Professional and W estlaw uk[J].Legal Information Management,2006,6(4):246-250.

(250)Zabed Ahmed,S.M.,Cliff Mcknight,Charles Oppenheim.A Review of Research on Human-computer Interfaces for Online Information Retrieval Systems[J].The Electronic Library,2009,27(1):96.

(251)缪融.基于外文数据库的交叉语言信息检索系统的探讨[J].情报杂志,2007(3):118-120.

(252)唐振宇.图书馆个性化信息服务跨库检索系统研究[J].情报科学,2008(9):1385-1389.

(253)Kumar C.Aswani,Gupta Ankush,Batool Mahmooda,Trehan Shagun.LatentSemantic Indexing-based Intelligent Information RetrievalSystem for Digital Libraries[J].Journal of Computing and Information Technology,2006,14(3):191-196.

(254)Gerhard Weikum,Gjergji Kasneci,Maya Ramanath,Fabian Suchanek.Database and Information-retrievalMethods forKnowledgeDiscovery[J].Communications of the ACM,2009,52(4):6.

(255)周彩云.浅析国内集成化信息检索平台的研发[J].中南民族大学学报:人文社会科学版,2008(9):160-163.

(256)许春漫.数字图书馆个性化信息检索模型研究[J].现代图书情报技术,2006(3):15-19.

(257)苏菊,王栋.一种基于读者借阅信息的图书检索结果客观排序算法研究[J].现代图书情报技术,2008(7):86-90.

(258)Saunders Laura.Exploring Connections Between Information Retrieval Systems and Information Literacy Standards[J].Library&Information Science Research,2008,30(2):86-93.

(259)Tamdogan,OyaGurdal.Information RetrievalSystems in Information Chain,Library Institution and Other Information Centers in Information Retrieval[J].Turkish Librarianship,2009,23(1):151-168.

(260)Ian Cornelius.Quantum Leaps in Information Retrieval[C].Aslib Proceedings,2009,61(3):331.

(261)Anup Kumar Das,ChaitaliDutta,Sen,B.K..Information Retrieval features in indian digital libraries:a critical appraisal[J].OCLC Systems and Services,2007,23(1):92.

(262)徐勇.学术搜索引擎在科技查新中的应用[J].浙江高校图书情报工作,2009(1):58-61.

(263)梁丽明.Dialog系统在医学科技查新中的应用[J].中国西部科技,2010(5):45-47.

(264)于世花.搜索引擎在科技查新中的作用[J].科技情报开发与经济,2010(1):108-109.

(265)葛敬民.实用网络信息检索[M].北京:高等教育出版社,2009.

(266)通识教育规划教材编写组.信息检索[M].北京:人民邮电出版社,2010.

(267)潘燕桃.信息检索通用教程[M].北京:高等教育出版社,2009.

(268)敬卿,王群.从传统信息检索到面向知识创新——信息检索课改革与发展前沿述评[J].图书馆,2008(1):58-59.

(269)王泽琪,周凤飞.体现本科专业特点的信息检索课程教学内容研究[J].图书馆工作与研究,2007(3):95-97.

(270)孙丽芳.网络环境下信息检索课协作式教学策略实施[J].图书馆论坛,2006(4):209-211.

(271)华薇娜.在信息检索课程中贯穿个案分析的实验及其意义分析[J].情报杂志,2006(3):136-138.

(272)回雁雁.信息检索与利用课进行实践教学改革的探索[J].图书馆理论与实践,2008(3):128-130.

(273)何钧.信息检索课课程成绩评定的思考与研究[J].图书馆杂志,2006(10):69-71.

(274)冯凯,李雪萍.信息检索课多媒体教学神经网络评价模型[J].情报杂志,2006(9):144-145.

(275)Esther S.Grassian,Joan R.Kaplowitz.Information Literacy Instruction: Theory and Practice[M].New York:Neal-Schuman Publishers,2009.

(276)David Bawden.Information Seeking and Information Retrieval:the Core of the Information Curriculum[J].Journal of Education for Library and Information Science,2007,48(2):25.

(277)Ina Fourie,Theo Bothma.Addressing the DigitalDivide in Teaching Information Retrieval;a Theoretical View on Taking Students from Ict Access to Knowledge Sharing[J].TheElectronic Library,2006,24(4):469.

(278)Jeffrey T.Child,Judy C.Pearson,NajlaG.Amundson.Technology Talk: Public Speaking Textbooks'Coverage of Information Retrieval Technology Systems[J].Communication Quarterly,2007,55(3):267.

(279)熊鹰.《信息检索与利用》网络课程的教学设计与实现[J].图书馆论坛,2006(4):23-25.

(280)沈艳红.WebQuest在信息检索课教学中的应用[J].图书馆杂志,2006(11):64-66.

(281)马铭锦,杨伟兵.基于JSP的信息检索课网上教学系统的设计与实现[J].现代图书情报技术,2006(6):77-79.

(282)陈晓瑜.利用Blackboard构建“信息检索课”远程教学平台开展在线信息素质教育的实践与体会[J].图书与情报,2007(5):64-67.

(283)冯凯.信息检索课程基于Agent的网络教学系统设计与开发[J].情报理论与实践,2007(3):423-426.

(284)Chutima Sacchanand,Vipa Jaroenpuntaruk.Development of a Web-based Self-training Package for Information Retrieval Using the Distance Education Approach[J].The Electronic Library,2006,24(4):501.

(285)陈仕吉.科学前沿研究探测方法综述[J].现代图书情报技术,2009(9):28-33.

(286)殷蜀梅.判断新兴研究趋势的技术方法分析[J].情报科学,2008(4):536-540.

(287)冯璐,冷伏海.共词分析方法理论进展[J].中国图书馆学报,2006(2):88-92.

(288)蒋颖.1995—2004年文献计量学研究的共词分析[J].情报学报,2006,25(4):503-512.

(289)Small,H..Tracking and Predicting Growth Areas in Science[J].Scientonretrics,2006,68(3):595-610.

(290)Small,H.,Upham,P.Citation Structure of an Emerging Research Area on the Verge of Application[J].Scientometrics,2009,79(2):365-375.

(291)Chen Chaomei.CiteSpace II:Detecting and Visualizing Emerging Trends and TransientPatterns in Scientific Literature[J].Journal of the American Society for Information Science and Technology,2006,57(3):359-377.

(292)Klavans,R.,Boyack,K.W..Identifying a Better Measure of Relatedness forMapping Science[J].Journal of the American Society for Information Science and Technology,2006,57(2):251-263.

(293)Shibata,N.,Kajikawa,Y.,Takeda,Y.,et al..Detecting Emerging Research Fronts Based on Topological Measures in Citation Networks of Scientific Publications[J].Technovation,2008,28(11):758-775.

(294)Takeda,Y.,Kajikawa,Y..Optics:a Bibliometric Approach to Detect Emerging Research Domains and Intellectual Bases[J].Scientometrics,2009,78(3):543-558.

(295)Garcia Cumbreras Miguel A.,Perea Ortega Jose M.,Garcia Vega Manuel,Urena Lopez L.A lfonso.Information Retrieval with Geographical References.RelevantDocuments Filtering vs.Query Expansion[J].Information Processing and Management,2009,45(5):605-614.

(296)David Mountain,Andrew Macfarlane.Geographic Information Retrieval in aMobile Environment:Evaluating the Needs ofMobile Individuals[J].Journal of Information Science,2007,33(5):515.

(297)Mathieu Roche,Violaine Prince.Information Retrieval in Biomedicine; Natural LanguageProcessing forKnowledge Integration[M].New York:IGIGlobal snippet,2009.

(298)W illiam Hersh.Information Retrieval:A Health and Biomedical Perspective[M].New York:Springer,2008.

(299)Meera.Office Information Retrieval in Digital Environment[J].Journal of Information Management,2008,45(1):111-118.

(300)Marijn Koolen,Jaap Kamps,Vincent De Keijzer.Information Retrieval in Cultural Heritage[J].Interdisciplinary ScienceReviews,2008,34(2/3):268.

(301)Saravanan,M.,Ravindran,B.,Raman,S..Improving Legal Information RetrievalUsing an Ontological Framework[J].Artificial Intelligence and Law,2009,17(2):101.

(302)Silvia Schenkolewski-Kroll,Assaf Tractinsky.Archival Description,Information Retrieval,and theConstruction of Thesauri in IsraeliArchives[J].Archival Scienc,2009,6(1):69.

(303)Smith,Alan D..Business and E-government Intelligence for Strategically Leveraging Information Retrieval[J].ElectronicGovernment:An International Journal,2009,5(1):31-44.

(304)许跃军.基于Ontology的政府信息检索技术[J].情报科学,2008(6):866-871.

(305)罗媛,甯青松,赵荣.我国政府网站的信息检索功能研究[J].图书情报工作,2009(S1):48-50.

(306)TREC2010.Call for Participation.[EB/OL].[2010-05-20].http://trec.nist.gov/call2010.html.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈