首页 百科知识 数字科学信息检索策略

数字科学信息检索策略

时间:2022-10-01 百科知识 版权反馈
【摘要】:[91]下面,本文将详细分析互联网科学信息检索的策略与步骤。数字信息的特点决定了纯粹依靠浏览方法来检索信息是行不通的;要提高检索效率,首先必须选择合适的数字信息检索工具。不过,数字科学信息检索工具数量众多、各有千秋。一般来说,选择数字科学信息检索工具可遵循以下规则。学科导航库是检索互联网科学信息的首选工具。

4.7 数字科学信息检索策略

互联网作为一种重要的科学信息载体,具有界面友好、功能强大和简单易用的特点,用户无需接受专门培训就能从事网上科学信息的检索;或者,更确切地说是在数字科学信息检索过程中,中介代理服务功能逐渐被削弱,用户与检索者之间的界线越来越模糊。用户群的新特点加上这种载体本身所具有的一些特性,导致在实践中数字科学信息的检索效果远远没有人们想象的那么有效。因此,掌握成功的检索策略成为信息检索中十分迫切的问题。所谓检索策略,是指在综合考虑特定信息需求、数字信息组织的特点以及数字检索工具的检索功能以后,为达到最佳检索效果而制定的检索方案;它实际上是一些检索技巧的集成。[91]下面,本文将详细分析互联网科学信息检索的策略与步骤。

4.7.1 分析检索课题

对检索课题进行分析,是正确选用检索工具、检索词和逻辑运算符的先决条件,也是检索质量和效果最优化的基础。分析检索课题要根据课题的目的、性质、类型、专业范围、主题结构等来进行,以便将检索课题分解成若干个既能代表信息需求又具有检索意义的主题概念,包括所需的主题概念有几个,概念的专指度是否合适,哪些概念是主要的,哪些概念是次要的,力求使分析得到的主题概念能反映检索的需要。

4.7.2 研究检索工具

数字信息的特点决定了纯粹依靠浏览方法来检索信息是行不通的;要提高检索效率,首先必须选择合适的数字信息检索工具。不过,数字科学信息检索工具数量众多、各有千秋。因此,必须要从检索工具的类型、收录范围等方面加以研究,这样在具体检索过程中才有可能结合检索问题的类型和具体要求选择合适的检索工具,从而提高检索效率。检索工具的研究方法包括以下几种:

追溯跟踪法。选用优秀检索工具的前提是充分考虑常用检索工具的资源发展情况、检索功能、检索效果等指标。而上述动态情况的掌握有赖于长期的跟踪考察,惟独跟踪方能及时掌握变革动态,对动态变化的积累方显检索工具本色,在动态数据之上的分析研究可去伪存真,从而使优秀的检索工具脱颖而出。

综合比较分析法。该法从跟踪掌握的动态数据中,对检索工具的数据采集容量、更新速度、检索功能、输出结果的形式,以月度、季度、年度为周期分别统计、综合比较,并配以图示法以提升其直观性。

检索实测法。选择若干个关键字、词预先组成提问式,或选用某个类目在欲比较的检索工具上测试,根据输出结果的相关性及其数量进行研究。这样,一方面可判断检索工具的优劣,另一方面可探究检索式的准确表达形式。

4.7.3 选择检索工具

对用户的信息需求和各种数字信息检索工具有了相当了解以后,接下来就应该选择具体的检索系统。一般来说,选择数字科学信息检索工具可遵循以下规则。

(1)学科导航库是检索互联网科学信息的首选工具。学科导航库通常由信息工作者和本学科领域的专家共同对数字信息资源采集、筛选、整理和加工而成,也就是说对互联网上的科学信息进行了资源鉴别、重组与开发,具有较高使用价值。因此,科研人员和专业工作者检索互联网科学信息,应该首先选择学科导航库。著名的学科导航库如The Argus Clearinghouse(http://www.clearinghouse.net),收录了许多有价值的多学科主题目录,对互联网上的信息资源进行了甄别、筛选、归类、描述和评价,并按学科主题层层排列,用户可以很方便地检索其收录的经过挑选的信息资源。其他著名的学科网关还有BUBL Link(http://www.bubl.ac.uk/link)、Pinakes(http://www.hw.ac.uk/lib.www.irn/pinakes/pinakes.html)、AlphaSearch(http://www.calvin.edu/library/scarreso/internet.as/)、AcademicInfo(http://academicinfo.net/cdp/html)[92],以及国内CALIS系统的重点学科导航库等。

(2)注意搜集网络数据库的相关信息,适时加以利用。当检索目标明确,检索条件及可检数据库网址清楚时,应选择直接进入目标数据库。目前互联网上的全文数据库检索相当于传统的一次文献检索,输出的检索结果常常是全文或有关详细信息,使用价值很高。而且还有许多数据库是免费提供的。例如,如果检索目标是发达国家的专利,那么就应该直接进入欧洲专利局及欧洲专利组织在互联网上推出的免费专利数据库(http://ep.espacenet.com);或直接进入美国专利数据库(http://www.uspto.gov)检索……因此,在网上漫游或者在平常工作中,及时记录意外发现的数据库网站及其适用范围,积累起来形成数据库网站列表,适时选用可免走弯路并节省费用,是一种低成本、高效率的检索。但是,如果检索目标模糊或目标明确但不清楚该进入哪个数据库时,可以首先选择索引擎,然后通过搜索引擎提供的线索找到目标数据库。

(3)选择搜索引擎。搜索引擎是极其重要的信息搜寻工具,根据搜索引擎数据库收录内容、检索方法、结果输出形式的不同,加上数字科学信息检索实践经验的积累,可以形成选择搜索引擎的基本思路:不知如何使用关键词可利用概念检索,应选用Excite;查找网上冷僻站点应选用AltaVista;无特殊查询要求可用雅虎;细节性问题用天网、AltaVista;站点评论检索用Lycos Top5(http://point.lycos.com)、eBlast(http://www/ebig.com)或者专业网站评价工具,如Sixth Senses Reviews:A Heathcare and Medical Web Site ReviewProgram(http://www.sixsenses.com)、Med World Best Sites(http://www.med.standford.eduschool/Med/World/Medlinks)等。还需注意的是,就搜索范围而言,大多数检索工具只能检索Web本身,少数能检索Usenet新闻组索引。因此,查询主页应使用雅虎、InfoSeek;查询FTP,使用Archie;查询News,使用DijaNews;允许用户查询就近一组非互联网数据库信息的有InfoSeek。另外,就索引组织而言,每种检索工具所提供的检索结果中都有一个网页的URL地址和标题索引,多数检索工具还有每段的标题索引,有些检索工具还记录了频繁提到的词或文本的头几行,用户可根据自己在这方面的要求对搜索引擎加以选择。最后,实践中用户还必须经常在以下两组范畴中对搜索引擎加以选择。

一是专业搜索引擎与综合搜索引擎的选择。一般来说,综合搜索引擎覆盖面广,但是通常未能对数字信息资源的质量进行挑选、审查,对站点或页面的描述也不多,用户需要花费大量时间浏览、筛选信息,因此用户不应该一开始就用这类搜索引擎,而应尽量选择专业学科搜索引擎。这些检索工具指向特定的学科领域,其针对性强于前者,检索起来有事半功倍的显著效果。例如生物和化学信息选择(http://biotec.chem.indiana.edu/lib/search.html)和(http://www.chemcenter.org/eaech.html);农业信息应选择(http://www.ceregroup.com/cgi-bin/find-agweb.cgi);标准信息可选择中国标准(http://www.chnaiso.com)或(http://www.cssn.net.cn/)、美国标准(http://www.ansi.org)、国际标准(http://www.iso.ch);工程信息选择(http://www.ub2.1u.se/eel/eelhome.html)或(http://www.eevl.ac.uk/sear.html);物理和数学信息分别选择(http://physlink.com)、(http://archives.math.utk.edu/query.html);医学与卫生信息选择(http://omni.ac.uk)和(http://www.achoo.com);科技报告有价值的网站是航空航天技术报告服务(http://techreports.larc.nasa.gov/cgi-bin/NTRS)、美国政府报告服务NTIS(http://www.ntis.gov)、美国能源部信息通道(http://www.osti.gov/bridge)。如果在使用这些搜索引擎以后发现检索效果仍不理想,例如相关信息太少,就可以考虑使用诸如Infoseek、AltaVista、Excite和Hotbot等在查找数字科学信息方面较为有效的综合型搜索引擎。

二是主题指南、全文搜索引擎与元搜索引擎的选择。主题指南类搜索引擎是人工建立的、结构化的互联网网址主题类目和子类目;它按照时间、地点、主题等顺序进行排列,允许用户从等级类目中任意选择检索范围,来对这些不同深度的主题类目进行浏览或检索。当用户尚未形成很精确的检索概念时,采用主题指南作检索起始点,从大类逐步进入小类,直至细化到想要查找的信息,检索效果令人满意。总的来说,主题指南型搜索引擎比较适合于查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。如果用户不熟悉其分类体系或对分类标准的理解与系统人员不一致,就会影响检索效果。全文搜索引擎则强调检索功能,提供对关键词、主题词或自然语言的查询,当用户在搜索框中输入检索词或检索表达式后,每个搜索引擎都会以其特定的检索算法在其数据库中找出相关记录,并试图按相关性大小顺序排列以后显示给用户。它具有检索面广、信息量大、信息更新速度快等优点,非常适用于检索特定的信息及较为专深、具体或类属不明确的检索课题,缺点是检准率方面有所欠缺。元搜索引擎由于集成了多个搜索引擎,因此一般来说能够提供最全面的检索结果。

4.7.4 确定检索项

检索项是根据检索课题涉及的专业内容所提出的能够全面、确切表达主题概念的检索词。检索词选择得当与否,直接影响检索效果。检索词可以是规范词也可以是自然语言。其中规范词是规范化的语词,是受控词汇,它取自主题词表。表达同一主题概念的主题词,在任何情况下其字面形式都是一致的。而自由语词是自然状态的语词,属于非受控词汇。自由语词对同一主题概念的表达,在不同情况下有不同的字面形式。由于信息加工人员在标引时往往采用适当的规范词进行主题标引,因此在检索时应遵循优先使用规范词,根据实际情况恰当使用自由词的原则。在使用自由语词进行检索时,为了能够使检索信息尽可能全面,还应找出检索词的近义词或同义词以扩大检索范围。

4.7.5 构造检索式

确定检索项以后,就要构造一个既能表达检索需求,又能为计算机识别的检索提问式。所谓提问式,就是利用布尔逻辑运算符、位置运算符、截词符、限制符等机制,对检索项进行合乎逻辑的组配,确定词间的概念关系或位置关系,准确地表达检索课题。它也是检索策略的具体体现。因此,构造适当的检索式非常重要。而适当的检索式的构造,是建立在用户了解和熟悉各种检索工具的检索句法、所支持的检索运算以及使用的检索标识符号等各种机制的基础之上的。以布尔逻辑检索为例,它利用布尔逻辑算符进行检索词的逻辑组配。其符号形式主要有逻辑与(AND)、逻辑或(OR)和逻辑非(NOT)。在这三种组配技术中,使用“逻辑与”组配技术,将会缩小检索范围,增强检索的专指性,提高信息的查准率。“逻辑或”组配技术,可扩大检索范围,提高信息的查全率。使用“逻辑非”组配技术,剔除了不需要的概念,可提高信息的查准率;但这种方式也会排除掉相关信息,因而影响检索的查全率。使用布尔逻辑组配检索词构成的检索式,逻辑算符AND、OR、NOT的运算次序在不同的检索系统中有不同的规定。另外需要指出的是,在一般情况下OR很少用,因为按这种组配方式进行检索会得到很多不相关的信息,而且有许多网上服务器不支持带OR的检索式。如果我们要排除同名但不同词义的词组,可以使用NOT组成检索式,但必须注意有些检索工具不能执行NOT逻辑运算符,如雅虎和Lycos。另外,还有一些检索系统使用位置算符。例如要求检索工具帮助查找在一篇文献的标题中包含的所有主题词,而且这些词相隔不远,就可使用位置运算符Near来组配,这种检索式有助于缩小检索范围。

4.7.6 调整检索策略

如果数字科学信息检索没有达到预期的检索效果,用户就必须调整自己的检索策略。夏立新先生认为可以在原来检索结果的基础上采取扩检或缩检的措施,使检索结果尽可能达到预期效果。[93]

(1)扩检

对查全率要求较高的检索课题,检索过程的调整主要从扩检入手,可采取以下措施:

①选用多个检索系统、工具或同一检索系统中的多个数据库。不同的检索系统有不同的信息收集范围和准则,选用多个系统,虽然检索结果中重复现象增多,但查全率也会相应提高。对于同一学科领域不同方面或不同范围的数据,有的检索系统采用不同的数据库或文档来组织,例如Dialog系统中与“医药”有关的数据库多达45个,化学文摘数据库目前根据收录文献的年代被分为7个文档,如果在检索过程中增加数据库或文档的数量无疑会提高查全率。

②降低检索词的专指度,尤其对于采用受控语言检索的系统,可以从系统词表中(主题分类表、叙词表等)或命中文献中选一些上位词检索或者在上位类目中检索。受控语言是根据情报检索的需要而创制和不断改进的,其发展过程是从分类语言、标题语言、叙词语言,到为实现自然语言检索而设计的后控制语言等。分类标识能提供族性检索,有利于扩检和缩检,从而实现不同范围内的查全。互联网环境下,许多检索系统仍然采用主题分类表来组织信息,如雅虎,万方数据有限公司的数字化期刊系统,美国国会图书馆的“美利坚记忆”项目和中国数字图书馆工程等数字图书馆。将检索范围限定在这些检索系统事先编制的主题分类表中的上位类目,或者在上位类目中进行浏览式检索通常会增加命中文献的数量。同样,采用叙词表中的上位词检索通常也能增加命中文献的数量,但完全采用叙词这样的受控语言检索在互联网上极为罕见,倒是有采用叙词与自由词结合的检索,如Medline采用多元主题词表(Metathesaurus)和自由词相结合的形式检索。

③调节检索提问表达式的数字度,以删除某个不重要的概念组面。

④采用截词检索。截词的形式通常有前方一致、后方一致和中间一致。有的检索系统提供了截词检索功能,运用这样的检索系统从事数字科学信息检索时,可以采用系统规定的截词算符检索某一单元词可能构成的全部复合词。这肯定有助于增加命中文献的数量。不过另一方面,采用截词检索也可能导致大量误检。

⑤利用布尔逻辑算符“或”来连接同义词、近义词或词的不同拼写形式,即增加用“或”逻辑连接的相关检索词。在人类语言中词的同义关系普遍存在。这些相关的检索词用逻辑“或”运算符连接,将会增加命中文献的数量。

⑥增加检索途径。用户尽可能地利用检索系统所提供的各种检索途径,如题名、作者、出版者、关键字或词以及其他有检索意义的单元,有的系统还提供了各种检索途径的逻辑运算。如中国期刊网的高级检索功能提供了篇名、作者、关键词、全文、机构、中文摘要、引文、基金、中文刊名、年、期等几乎所有可能的检索途径,并且提供了任意检索途径的逻辑运算(AND和OR)。

⑦取消某些过严的限制,适当使用关键字或词在标题、文摘甚至全文中查找。例如中国期刊网,如果使用关键字或词在关键词字段中检索效果不理想,可以考虑使用同样的关键字或词在篇名、中文摘要甚至全文中检索。

⑧分层次进行检索。将要求检索的内容分析为不同层次及同层次的不同方面,然后从这几个层次和方面分别进行检索,再对检出的文献进行分析、综合,得出完全相关的文献。

(2)缩检

对查准率要求较高的检索课题,检索过程的调整主要从缩检入手,可采取以下措施:

①提高检索词的专指度。如果说降低检索词的专指度可以增大检全率的话,提高检索词的专指度自然会提高检准率。

②提高检索提问表达式的网罗度,通常的做法是在检索提问表达式中增加概念组面。

③增加概念进行限制,用逻辑乘联结主题词来限定主题概念的相关检索项;利用NOT限制一些不相关的概念。用AND连接的两个检索词表示这两个检索词必须同时出现在结果中才满足检索条件;而用NOT连接的两个检索词表示应从第一个概念中排除第二个概念才满足检索条件,显然这样的限定或连接可以缩小检索范围。

④利用某些检索系统所提供的限定检索功能。这是计算机情报检索系统广泛采用的一种检索方法,它可以缩小检索范围,减少无关信息的输出,从而实现缩检的目标。例如,在Dialog系统中与“医药”有关的数据库或文档多达45个,但通过“预检”可以从中选择所需要的数据库作为检索对象;在“中国期刊网”,我们可以将检索的范围限定在相应的主题类目,还可以将关键字或词限定在关键词字段或题名字段。在以搜索引擎为代表的数字科学信息检索工具中,限定条件也多种多样,通常包括:限定关键词必须出现在页面中的某个位置,如限定在标题、统一资源定位符(URL)、链点文字、网页文字、特定站点等部分;限定两个关键词在文本中的距离,也称相邻度检索或邻近检索;限定日期,如特定日期之前或之后的网页,最近某段时间内建立或修改的网页等;限定地区或域名

⑤利用某些检索系统提供的二次检索功能。例如天网和谷歌都提供“在结果中查询”的功能。

⑥利用某些检索系统提供的短语检索功能。所谓的短语检索是把组成词组或短语的若干词作为一个关键词进行检索,它可以提高检准率,但有时会漏检些相关资源。通常的做法是,把组成词组或短语的若干词加上双引号,以示与单个词的区别。

【注释】

[1]吴开华等.数字图书馆元数据研究[N].中国图书馆学报,2002(3): 43-46.

[2]岳权等.数字环境下的信息组织研究[J].情报理论与实践,2002(2):99-101,94.

[3]司莉.数字信息资源组织与揭示及其优化研究[D].武汉:武汉大学,2003:53.

[4]Joan S.Mitchell:Dewey Decimal Classification:Knowledge Organization Tool for the 21stCentury[J].OCLCNewsletter,1996(222):32-36.

[5]搜狐搜索引擎[OL].http://dir.yahoo.com.

[6]Yahoo!Directory[OL].http://www.sogou.com/dir/.

[7]柏鹏英.传统信息组织方法在数字环境下的运用[J].情报资料工作,2002(5):54-56.

[8]杨涛.主题法在数字信息组织中的应用[J].图书馆建设,2002(1): 50-52.

[9]张晓林.数字化信息组织的结构与技术(二)[N].大学图书馆学报,2001(5):19-24.

[10]Virtual Journal of Biological Physics Research[OL].http://www.vjbio.org/(访问日期:2007-8-30)

[11]Journal of Articial Intelligence Research[OL].http://www.jair.org/(访问日期:2007-8-30)

[12]储节旺,郭春侠.论数字信息组织[J].情报理论与实践,2000(4): 243-244.

[13]关飞霞.从信息组织模型的角度看数据库技术的发展[J].图书情报工作,1999(7):11-14.

[14]陈越.三种中文书目数据库及其CNMARC数据的比较研究[J].图书馆理论与实践,2003(4):9-10,28.

[15]HSDB Search[OL].http://toxnet.nlm.nih.gov/cgi-bin/sis/htmlgen?hsdbadv.htm(访问日期:2007-10-31)

[16]王兰成.全文数据库建库原理与应用技术[J].情报学报,1999(4): 319-326.

[17]Datebase Help-EBSCOHelp[OL].http://support.ebsco.com/help/?int=ehost&lang=en&feature_id=Databases&TOC_ID=Always&SI=0&BU=0&GU=1&PS=0&dbs=buhjnh,buh(访问日期:2007-10-31)

[18]Academic Search Elite(Ebsco)[OL].http://www.uwp.edu/departments/library/journals/databases/ebsco.htm(访问日期:2007-10-31)

[19]EBSCO数据库简介[OL].http://www.ebsco.com.cn/EhostDB/EBSCOhost_DB_Intro.htm#BSP(访问日期:2007-10-31)

[20]Journals-Elsevier[OL].http://www.elsevier.com/wps/find/journal_browse.cws_home/(访问日期2007-10-31)

[21]中国期刊全文数据库[OL].http://cnki1.lib.whu.edu.cn/kns50/jianjie/introduction.aspx?id=1&dbcode=CJFD(访问日期2007-10-31)

[22]万方数据标准镜像系统[OL].http://wanfang.lib.whu.edu.cn:90/(访问日期2007-10-31)

[23]维普咨询-中文科技期刊数据库[OL].http://vip.lib.whu.edu.cn/index.asp(访问日期2007-10-31)

[24]林华.多媒体数据库及其在军事信息系统中的应用[J].系统工程电子技术,1998(10):71-73.

[25]Swan A.Open Access Self-archiving:An introduction[OL].http://www.keyperspectives.co.uk/openaccessarchive/reports/Open%20access%20self-archiving% 20-%20an%20introduction.pdf(访问日期:2007-9-3)

[26]Registry of Open Access Repositories(ROAR)[OL].http://roar.eprints.org/?action=home&q=&country=&version=&type=&order= name&submit=Filter(访问日期:2007-9-12)

[27]图片来源:http://celestial.eprints.org/cgi-bin/eprints.org/graph(访问日期:2007-9-12)

[28]Proportion of Repositories by Continent-Worldwide[OL].http://www.opendoar.org/onechart.php?cID=&ctID=&rtID=&clID=&lID=&potID=&rSoftWareName=&search=&groupby=c.cContinent&orderby=Tally% 20DESC&charttype=pie&width=600&height=300&caption=Proportion%20of% 20Repositories%20by%20Continent%20-%20Worldwide(访问日期:2007-10-1)

[29]图片来源:OpenDOARChart-Proportion of Repositories by Country[OL].http://www.opendoar.org/onechart.php?cID=&ctID=&rtID=&clID=&lID=&potID=&rSoftWareName=&search=&groupby=c.cCountry&orderby=Tally% 20DESC&charttype=pie&width=600&height=300&caption=Proportion%20of% 20Repositories%20by%20Country%20-%20Worldwide(访问日期:2007-9-12)

[30]图片来源:OpenDOAR Chart-Most Frequent Languages in OpenDOARWorldwide[OL].http://www.opendoar.org/onechart.php?cID=&ctID=&rtID=&clID=&lID=&potID=&rSoftWareName=&search=&groupby= l.lName&orderby=Tally%20DESC&charttype=bar&width=600&caption=Most% 20Frequent%20Languages%20in%20OpenDOAR%20-%20Worldwide(访问日期: 2007-9-12)

[31]图片来源:OpenDOARChart-Subjects in OpenDOAR-Worldwide[OL].http://www.opendoar.org/onechart.php?cID=&ctID=&rtID=&clID=&lID=&potID=&rSoftWareName=&search=&groupby=cl.clTitle&orderby=cl.clCode&charttype= bar&width=600&caption=Subjects%20in%20OpenDOAR%20-%20Worldwide(访问日期: 2007-9-12)

[32]http://repec.org/

[33]http://ntrs.nasa.gov/search.jsp.

[34]http://adsabs.harvard.edu/

[35]http://www.ncstrl.org/

[36]http://liinwww.ira.uka.de/bibliography/Misc/CPS.html.

[37]图片来源:OpenDOAR Chart-Open Access Repository Types-Worldwide[OL].http://www.opendoar.org/onechart.php?cID=&ctID=&rtID=&clID=&lID=&potID=&rSoftWareName=&search=&groupby=rt.rtHeading&orderby= Tally%20DESC&charttype=pie&width=600&height=300&caption=Open% 20Access%20Repository%20Types%20-%20Worldwide(访问日期:2007-9-12)

[38]东方.非正式信息交流模式——我国电子预印本系统探析[J].图书馆学刊,2006 Vol.28 No.6:52-53.

[39]MacKenzie Smith.DSpace:An Institutional Repository from the MIT Libraries and Hewlett Packard laboratories[C].ECDL 2002:543-549.

[40]RaymCrow.The Case for Institutional Repositories:A SPARC Position Paper.SPARC:Scholarly Publishing&Academic Resources Coalition,2002[OL].http://www.arl.org/sparc/IR/ir.html(访问日期:2007-9-8)

[41]Raym Crow.Institutional Repository Checklist and Resource Guide.SPARC:Scholarly Publishing&Academic Resources Coalition,2002[OL].http://www.arl/org/sparc/IR/IR-Guide.html(访问日期:2007-9-8)

[42]RaymCrow.The Case for Institutional Repositories:A SPARC Position Paper[OL].http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf l(访问日期:2007-9-20)

[43]Nancy Fried Foster,Susan Gibbons.Understanding Faculty to Improve Content Recruitment for Institutional Repositories[J/OL].D-Lib Magazine,Vol.11 No.1.http://www.dlib.org/dlib/january05/foster/01foster.html(访问日期:2007-9-20)

[44]Institutional Repositories:Innovation in Scholarly Publishing[OL].http://www.carl-abrc.ca/projects/institutional_repositories/canadian_projects-e.html(访问日期:2007-9-20)

[45]Clifford A.Lynch.Institutional Repositories:Essential Infrastructure For Scholarship In The Digital Age[J].Libraries and the Academy,2003,Vol.3,No.2: 327-336.

[46]RaymCrow.The Case for Institutional Repositories:A SPARC Position Paper[OL].http://www.arl.org/sparc/bm~doc/ir_final_release_102.pdf(访问日期:2007-9-20)

[47]Summary of the Annual General Meeting(2006)[OL].http://www.carlabrc.ca/horaire/2006/pdf/agm-060517-e.pdf(访问日期2007-9-24)

[48]荷兰名为“科学奶酪”的项目〈http://www.creamofscience.org/〉将该国数百位顶尖学者的出版物保存到国家机构仓储中,为机构仓储带来了声誉和法律保障。

[49]Gerard van Westrienen,Clifford A.Lynch.Academic Institutional Repositories:Deployment Status in 13 Nations as of Mid 2005[J/OL].D-Lib Magazine,2005,Vol.11,No.9.http://www.dlib.org/dlib/september05/westrienen/09westrienen.html(访问日期:2007-8-31)

[50]EPIC(2004),Swan,A.,P.Needham,S.Probets,A.Muir,A.O'Brien,C.Oppenheim,R.Hardy and F.Rowland.Delivery,Management and Access Model for E-prints and Open Access Journals within Further and Higher Education,A joint report by The Electronic Publishing Innovation Centre(EPIC)in partnership with Key Perspectives Limited[R/OL].http://www.jisc.ac.uk/uploaded_documents/ACF1E88.pdf(访问日期:2007-10-15)

[51]OSI Guide to IR Software-3rd ed(2004)[OL].http://www.soros.org/openaccess/pdf/OSI_Guide_to_Institutional_Repository_Software_v3.pdf(访问日期:2007-8-31)

[52]Gerard van Westrienen,Clifford A.Lynch.Academic Institutional Repositories:Deployment Status in 13 Nations as of Mid 2005[J/OL].D-Lib Magazine,2005,Vol.11,No.9.http://www.dlib.org/dlib/september05/westrienen/09westrienen.html(访问日期:2007-8-31)

[53]此表系根据ROAR和OpenDOAR两家主页2007年9月21日的数据整理。其中,Fedora和Fez/Fedora在ROAR中分列为两种系统软件,在此表中进行了合并。

[54]江瑞其.国外机构库发展概况[J].图书情报工作,2005(11):142-145,149.

[55]http://www.dspace.org/

[56]http://www.eprints.org/software/

[57]http://cdsware.cern.ch/invenio/index.html

[58]CERNDocument Server[OL].http://cdsweb.cern.ch/(访问日期:2007-10-2)

[59]http://fedoraproject.org/

[60]Thornton Staples,et al.The Fedora Project:An Open-source Digital Object Repository Management System[J/OL].D-Lib Magazine,2003 Vol.9 No.4.http://www.dlib.org/dlib/april03/staples/04staples.html(访问日期:2007/ 10/1)

[61]http://www.i-tor.org/

[62]http://www.mycore.de/

[63]P.Ginsparg.Electronic Publishing in Science[OL].Conference on Electronic Publishing in Science,Paris 1996.http://arXiv.org/blurb/pg96unesco.html(访问日期:2007-10-1)

[64]数据摘自arXiv网站该日主页。

[65]Mirror sites and other servers[OL].http://arxiv.org/servers.html(访问日期:2007-10-1)

[66]图片来自:许鑫,苏新宁高校数字资源整合平台研究.http://61.132.74.56/web/file/9.doc(访问日期:2007-9-23),有所修改。

[67]数据来自奇迹文库当日主页。

[68]张睿.搜索引擎的发展和再认识浅析[OL].http://www.blogchina.com/new/display/4102.html(访问日期:2007-8-30)

[69]王曰芬等.数字信息资源检索与利用[M].南京:东南大学出版社,2003:48.

[70]为何选用[OL].http://www.google.com/why_use.html(访问日期2007年)

[71]即Page RankTM,当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”,Google根据网页的得票数评定其重要性;另外,除了考虑网页得票数(即链接的数量)之外,Google还分析投票网页的重要性——“重要”网页所投之票分量较重,有助于增强其所链接网页的“重要性”。

[72]起始日期:加龙http://webuc.net/ddf3/archive/2007/08/31.aspx(访问日期2007年)

[73]关于百度——百度在中国[OL].http://www.baidu.com/about/ index.html(访问日期2007年)

[74]薛万新.常用中文搜索引擎的特征分析[J].科技情报开发与经济,2004(7):209-210.

[75]Yahoo!Directory[OL].http://dir.yahoo.com/(访问日期2007-10-31)

[76]搜狐公司—搜狐网站[OL].http://corp.sohu.com/indexcn.shtml#(访问日期2007-10-31)

[77]薛万新.常用中文搜索引擎的特征分析[J].科技情报开发与经济,2004(7):209-210.

[78]搜狐搜索引擎[OL].http://www.sogou.com/dir/(访问日期2007-10-31)

[79]张蕊.闻香识引擎——谈发展中的搜索引擎模式[N].中国计算机报,2000(47):362.

[80]王芳,张晓林.元搜索引擎:原理与利用[J].现代图书情报技术,1998(6):18-21.

[81]相关信息和说明来源于谷歌学术搜索网站http://scholar.google.com(访问日期:2007-10-9)

[82]国家科学图书馆联合目录与Google Scholar连接正式开通[OL].http://www.cas.ac.cn/html/Dir/2006/04/30/14/03/07.htm(访问日期:2007-10-3)

[83]相关资料和数据来自OAIster网站http://www.oaister.orgl(访问日期: 2007-10-3)

[84]DLF门户网站和DLF的MODS门户网站是密歇根大学数字图书馆制作服务(University of Michigan Digital Library Production Service)的后续项目,也是美国博物馆与图书馆协会基金项目(IMLS,Institute of Museumand Library Services)的组成部分。前者的目的是测试第二代OAI可收割的资料,后者的目的在于测试传播、显示MODS增强元数据格式,并使之能够被搜索到(searchable)的适当方法。门户网站涵盖所有可收割的DLF仓储。——作者注。

[85]Computer and Information Science Papers CiteSeer Publications ResearchIndex.http://citeseer.ist.psu.edu/(访问日期:2007-10-14)

[86]数据来源于开放存取期刊名录网站主页http://www.doaj.org/(访问日期:2007-10-10)

[87]谭从容,阮春英.关于DOAJ的概况、使用和影响分析[J].图书馆建设,2006(1):33-35.

[88]楼宏青.高校重点学科导航库建设探析[J].大学图书馆学报,2001(4):30-33.

[89]马自卫.数字图书馆及其体系结构实现的研究[J].现代图书情报技术,2002(2):3-5.

[90]张晓林等.数字图书馆建设的标准和规范[J].中国图书馆学报,2003(6):7-16.

[91]雷桂萍.网络科学信息检索的局限及其检索策略[J].情报杂志,2003(9):26-27,29.

[92]杨子惠、陈艳秋.合理使用搜索引擎提高网络科学信息检索质量[J].哈尔滨医药,2002(1):44-45.

[93]夏立新.网络信息检索的失误分析及扩检与缩检措施的选择[J].现代图书情报技术,2003(3):55-57.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈