首页 百科知识 万方数据库文献检索示例

万方数据库文献检索示例

时间:2022-08-26 百科知识 版权反馈
【摘要】:对它们的区分,可以更好地理解信息检索服务,也有助于图书馆信息服务的开展。异构信息整合检索和全息检索。用户信息需求可以划分为表达需求、认识需求、潜在需求三个层次,“以用户为中心”的信息检索服务类型也可相应的划分为三种。它有机地将用户信息需求与信息资源结合起来,是以用户为中心的服务理念的体现。数字时代信息检索服务是“以用户为中心”、“以信息资源充

第七节 信息检索服务

一、信息检索服务的概念

信息检索服务的概念通常与信息检索及文献检索混淆,但它们是不同的,前者指的是服务概念,而后者更多指的是技术和过程。对它们的区分,可以更好地理解信息检索服务,也有助于图书馆信息服务的开展。

1.信息检索

信息检索(Information Rrtrieval)是指将信息按一定方式组织和存储起来,并针对用户的需求找出所需要信息的过程和技术。它又可称为存储与检索(Information Strorage and Retrieval).

对于信息用户来说,信息检索仅指过程的后一部分,即信息的查找过程(Information Retrieval)。信息检索的目的是为解决特定的信息需求和满足信息用户的需要。它根据检索(查找)对象的不同,又可以分为文献检索、事实检索和数据检索。文献检索是传统检索服务中为用户提供的一种常见形式。

信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面。其核心为文本信息的索引和检索。

目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容,扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员,扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化和个性化的需要是现阶段信息检索技术发展的新趋势。

2.信息检索技术主要热点

(1)智能检索或知识检索。传统的全文检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息年代,利用关键词匹配很难满足人们的检索要求。智能检索利用分词词典、同义词典、同音词典改善检索效果;进一步还可在知识层或者概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果。智能检索还包括歧义信息和检索处理,将通过歧义知识描述库、全文索引、用户检索上下文分析和用户相关性反馈等技术结合处理、从而高效、准确地反馈给用户最需要的信息。

(2)知识挖掘。目前主要指文本挖掘技术的发展,目的是帮助人们更好地发现、组织、表示信息、提取知识,满足信息检索的高层次需要。知识挖掘包括摘要、分类(聚类)和相似性检索等方面。

自动摘要就是利用计算机自动地从原始文摘提取文摘。在信息检索中,自动摘要有助于用户快速评价检索结果的相关程度。在信息服务中,自动摘要有助于多种形式的内容分发。

自动分类可基于统计或规划,经过机器辨认形成预定义分类树,再根据文档的内容特征将其归类;自动聚类则是根据文档内容的相关程度进行分组合并。自动分类(聚类)在信息组织、导航方面非常有用。

相似性检索技术基于文档内容特征检索与其相似或相关的文档,是实现用户个性化相关反馈的基础,也可用于去重分析。

(3)异构信息整合检索和全息检索。在信息检索分布化和网络化的趋势下,信息检索系统的开放性和集成性越来越高。需要能够检索和整合不同来源和结构的信息。这是异构信息检索技术发展的基点,包括支持各种格式化文件,如TEXT、HTML、XML、RTF、MS office、PDF、PS2/PS、MARC、IS02709等处理和检索;支持多语种信息检索、半结构化数据和非结构化数据的统一处理;数据库检索的无缝集成以及其他开放检索接口的集成等。

所谓“全息检索”的概念就是支持一切格式和方式的检索,从目前实践来讲,发展到异构信息整合检索的层面,基于自然语言理解的人机交互以及多媒体信息检索整合等方面尚有待于进一步突破。

随着互联网的普及和电子商务的发展,企业和个人可获取并需要处理的信息量呈爆发式增长,并且其中绝大部分都是非结构化和半结构化数据。内容管理的重要性日益凸现,而信息检索作为内容管理的核心支撑技术,随着内容管理的发展和普及,将应用到各个领域,成为人们日常工作生活的密切伙伴。

3.信息检索服务的类型

信息检索广泛应用在经济社会各领域,对提高管理和服务效率起着重要的作用,而图书馆信息检索服务注重的是在用户的信息需求与丰富的信息资源之间建立一种有机联系。

用户信息需求可以划分为表达需求、认识需求、潜在需求三个层次,“以用户为中心”的信息检索服务类型也可相应的划分为三种。

(1)根据用户表达出的需求进行的检索服务。它主要是满足用户特定的信息需求,图书馆可以通过文献检索服务、定题检索服务、个性化信息检索定制服务等方式为用户服务,查新检索服务由于是根据用户明确提出的查新需求进行的服务,也可并入此类。

定题检索服务指的是根据用户的特定需要,对用户提出的检索课题进行系统的信息检索。

查新服务是满足用户对课题先进性的要求进行检索,这是一种特定性的服务,需要了解用户的课题性质和课题所涉及的信息资源进行全面检索,对用户课题的先进与否做出鉴定。

个性化信息检索定制服务是利用已有的技术为用户进行极具个性化的服务。

(2)根据用户认识到的需求进行的检索服务。图书馆可根据常见的用户信息需求、本馆信息资源建设情况以及专业领域的研究方向,有计划、有目的地实施一批这样的服务栏目,如浏览检索服务、信息导航服务、学科信息门户等,满足用户一般的信息需求,并帮助他们进一步查找所需信息,进一步明确自己真实的信息需求。

(3)根据用户的潜在需求进行的信息检索服务。用户的潜在信息需求如巨大的冰山,工作人员所能触及的只是冰山一角,潜在需求中的一部分被工作人员所认识,并以各种信息检索服务表现出来,那些仍未认识到的需求可通过知识服务被挖掘,但由于知识服务涉及有关知识发现等技术,知识服务的实践还有待于进一步研究、提高。

针对用户不同层次的信息需求,信息检索服务有不同的服务方法。

数字时代的信息检索服务是以Web网站为依托的信息检索服务,利用广泛的数字信息资源,根据用户特定的信息需求,主动地提供信息服务系统。它有机地将用户信息需求与信息资源结合起来,是以用户为中心的服务理念的体现。

二、信息检索服务

信息检索服务与信息检索这两个概念最大的不同在于信息检索服务是以用户需求为中心,并用一定的服务理念与方法去解决问题,有经营理念与相应的对策方法,是从整体考虑的。而信息检索则相对单纯。当然,信息检索技术是基础,图书馆要做好信息检索服务,需要时刻跟踪与利用信息检索技术的最新发展成果。

数字时代信息检索服务是“以用户为中心”、“以信息资源充分利用为目的”,为用户提供过滤后的信息。具体表现为对于那些用户表达出来的需求,信息检索服务通过信息推送、个性化定制等服务实现;对于那些用户认识到的普遍需求,信息被分门别类地组织好;对于那些潜在的信息需求,信息系统通过建立知识库等方式满足用户的需求。用户信息需求总是被图书馆工作人员不断感知、认识、再认识,从而在用户需要信息时,以最有利的时间、地点和方式,使用户顺畅地获取信息和使用信息。

信息检索广泛地应用在经济社会各领域,对提高管理和服务效率起着重要的作用,而图书馆信息检索服务注重的是在用户信息需求与丰富的信息资源之间建立一种有机的联系。针对用户的不同层次的信息需求,采用如下不同的服务方法:

1.文献检索方法

文献是用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体。文献不仅包括各种图书和期刊,而且还包括会议文献、科技报告、期刊文献、学位论文、科技档案等各种类型出版物,甚至包括用声音、图像以及其他手段记录知识的全部出版物。文献检索(Document Retrieval)是以文献为检索对象,从已存储的文献库中找出特定文献的过程。

文献检索服务,就是根据读者研究课题的实际需要,按照一定的标识系统与途径,从大量的书目、索引、题目、文摘等二次文献中,查找出与课题有关或有用文献的一种服务方法。检索服务的实质,是文献资料查找活动,它是科学研究活动的前期劳动。开展检索服务可以节省读者检索文献的时间和精力,开拓读者的知识视野,使科研人员在短时期内便能获得所需要的国内外文献资料。所以,它对科学研究活动有着十分重要的意义。

文献检索的程序,就是根据既定的课题,利用适宜的文献检索工具,通过不同的检索途径,按照一定的方法把合乎需要的文献挑选出来的过程,其程序如下:

(1)分析研究课题。包括:

①分析课题内容,确定查找需要的学科分类或主题概念。

②认真分析确定所需要查找的文献类型。由于文献类型繁多,查找不同类型的文献资料,可能得到完全不同的检索效果。

③分析查找年代。要根据课题的时代背景确定合适的查找年限,以提高检索效率。

④分析利用已知的文献线索,以便迅速准确地查找所需的未知文献。

分析研究课题是查找文献的第一步,也是关键的一步。

(2)选择检索方法。

文献检索方法,一般有以下三种:

①追溯法:这是指利用文章或专著后面所附的参考文献目录,追踪查找文献资源的方法,它不必利用检索工具,只要能掌握少数重要的文献著述,然后从一种文后引文到另一种文后引文跟踪追溯查找,就能获得一些所需的重要文献资料。这种方法主要缺点是所得的文献资料不够全面。如一些最新的科研成果、科技报告和科学论文,不可能立即在检索工具中集中收录反映。所以,我们要特别注意利用最新的述评与专著,因为述评与专著中所附参考文献一般是多而全、准而精,等于是一个小型专题文献索引,据此可以追溯,可大大提高追溯效果。

②常用法:利用各种文献检索工具进行文献查找,是文献检索工作中经常使用的一种方法,因此称为常用法。此种方法完全依赖于完善的检索工具,并严格按照检索工具规定的程序、途径和标识检索文献,能增强检索的广度和深度,使文献查全率、查准率得到可靠的保证,常用法是重大课题研究获得文献所必须采用的方法,它一般分为顺查法、倒查法和抽查法三种。

顺查法:依文献发表的时间顺序顺查,即由远到近逐年逐卷进行查找,一边查找一边筛选,找出所需文献。由于逐年逐卷查阅,因而漏检率较低,又因为在检索过程中不断筛选,因而误检率也低。顺查法的查全率和查准率较高,适用于科研课题复杂、查找范围大、时间长的文献需要。其缺点是费时费力,检索工作量大。

倒查法:依文献发表的顺序倒查,即由近及远,回溯而上,逐年逐卷进行检索,一边查找一边筛选,找出所需文献。倒查法适用于新兴的研究课题。优点是节省查找时间,为科技人员常用。但是,漏检率较顺查法高。

抽查法:即根据课题所属学科的发展特点及情况,查找学科发展兴旺阶段的文献,从而可得到较多的对口文献。因为任何学科的发展都有可能出现起伏变化。处在发展兴旺阶段时,发表文献就相应较多。反之,当学科处于低落阶段,发表文献会随之减少。利用抽查法查找文献,检索效率高,但用这种方法,在查找文献前,必须了解该学科的发展情况。

以上三种查找方法,都必须注意检索课题的时间性。从何时开始查找,或回溯查找到何时,或抽查何时的文献,都必须在了解该学科发展的情况下加以认真考虑。

③循环法:也叫分段法或交替法,是指追溯法和常用法交替进行,综合使用。在检索文献时,利用检索工具查找文献,又利用文后所附的参考文献追踪查找,两种方法分期分段交替使用。这种方法比较适应于年代期限不长的专题。它的优点在于:当检索工具不全或缺期的情况下,结合引文索引追查,也能获得读者所需年限的文献资料。

一般来说,检索工具比较齐全的大中型图书馆和情报部门,多采用常用法检索文献资料,而检索工具不够齐全的小型图书馆情报部门,多采用循环法与追溯法检索文献资料。

(3)选定检索工具。

检索工具的种类很多。选择用何种检索工具,取决于用户对检索工具的熟悉程度。在选择检索工具时,还要考虑该工具质量如何。衡量检索工具的质量,一般须考虑以下几个因素:收录的文献面、报道的文献量、编制质量、传递速度及索引齐全等。

(4)确定检索途径。

各种检索工具具有不同的检索途径,其中包括:

①分类途径:按照文献内容所属学科的性质,从分类索引入手查找文献的途径,就是分类途径。常用的工具书有图书分类目录,文献资料分类索引等。

②主题途径:根据文献主题内容,从主题入手查找文献的途径就是主题途径。利用主题索引,关键在于选准主题词。常用的工具书有主题索引、关键词索引等。

③著者途径:根据文献著者索引入手查找文献的途径就是著者途径。著者索引在检索工具中是最常见,人们常常通过著者索引来集中查找某一学者或机构的主要文献。

④号码途径:是根据已知文献本身的专用号码(如专利号、标准号、科技报告、合同号等)查找文献的途径。主要是利用“号码索引”进行检索,可以满足读者在课题中有关特种文献的具体需要。

⑤其他途径:包括分子式索引、地名索引、动植物名称、药物名称索引等,这类索引专指性强,往往是某些专业性或特种文献的工具所特有的辅助性检索途径。

确定检索途径,就是在上述诸多检索途径中选择查找所需文献的最佳途径。一般来说,主题途径和分类途径是文献检索的主要途径。在已经掌握著者、号码、地名、书名ISBN等已知条件下,可利用相应的检索工具迅速查找所需文献。总之,在进行课题检索时,要善于根据已知条件,综合利用各种途径,才能得到满意的检索效果。

(5)进行文献检索。

查找文献的内容范围要对口,文献的起讫年限要对口,文献类型和文种也要对口。对检索结果进行筛选,检索的资料要经过用户监定、筛选并及时编辑、整理,制成文摘,编印出专题索引,尽可能做到资料完整,内容新颖,对口实用。图书情报人员要同用户加强联系,共同研究,同步发展。做到每个阶段需要什么资料,就提供什么资料,遇到什么问题,就集中力量解决什么问题。

2.个性化信息检索定制服务

在信息检索服务中,不同的用户由于拥有的检索知识和所处领域不同,检索习惯也不同,初学者用简单检索,专业人员用高级检索。在实际工作中,存在用不同的词表示同一专业概念,不同的用户获取信息方式,对检索结果的排序都有可能不同。因而个性化的信息检索定制服务是信息检索“以人为本”的一个重要体现。

个性化信息服务是随着网络的广泛应用逐步发展起来的。个性化信息服务就是用户可按照自己的目的和需求,在某一特定网上功能和服务方式中,自己设定网上信息的来源方向、表现形式、特定网上功能及其他网上服务方式等,以达到最为方便快捷地获取自己所需的网上信息服务内容和目的。

个性化信息服务也是图书馆一个明显的发展趋势,个性化信息服务是一个宽泛的概念,个性化信息检索定制服务仅是它其中的一部分。

个性化信息检索定制服务指的是用户根据自己的目的与信息需求,在图书馆提供的检索服务中,将自己与检索有关的活动记录下来,可建立自己的个性化界面,根据个人需要选择浏览期刊和相关主题,也可长时间保留和调用自己的检索策略,从而满足自己的检索需求。目前,中国科学院文献情报中心的信息服务系统(如Science China),及引进的各大型网络数据库系统中,均提供了不同类型的信息定制服务,主要包括Alerts(速报和简报)、E-mail Alerts、My profile、My Folders、My Favorites等形式。

定制信息服务所需的技术已经成熟,如:

(1)Wed数据库技术:完成用户登录、身份认证、数据匹配等;

(2)网页动态生成技术:包括Asp、ISAU、CGT等技术,完成用户的个人检索界面的制作;

(3)数据推送技术:利用推送(PUSH)技术,完成信息的定向传送;

(4)过程跟踪技术:跟踪用户的检索兴趣,以便提供个性化的帮助;

(5)安全身份认证技术、数据加密技术:保护用户的隐私、保证系统的安全等;

(6)信息挖掘与智能代理技术:由知识库、规则库、推理机、各代理间的通信协议等组成的智能代理技术,可有效地跟踪用户的需求所在,满足个性化的需要。

个性化信息检索定制的内容:

(1)个性检索模板定制:根据用户专业领域、检索目的、检索的深度需求,时间需求、语言需求、数量需求等限制,进行个性检索模板定制;

(2)检索工具定制:可定制检索的数据库、搜索引擎等;

(3)检索表达式定制:根据需要可定制检索表达式,提高检索效率;

(4)个人词表定制:由于个人所处的专业领域与兴趣相对固定,他们所用的关键词相对有限。个人词表的定制可以帮助用户选词、确定检索范围;

(5)结果处理定制:根据个人的具体需求,可以对检索结果进行定制;

(6)检索历史分析定制:从用户的检索历史分析,可确定用户的需求所在;

(7)检索界面定制:可拥有自己的检索界面,方便,不受干扰;

(8)个性化信息推送:对于需要的信息可定时地推送。

信息定制服务的功能:

(1)可根据个人需求选择浏览的期刊和相关主题;

(2)可通过电子邮件获取网站提供的最新信息;

(3)可拥有个性化的检索界面;

(4)可长时间保留及调用自己的检索策略;

(5)可随时修改个人信息或取消定制服务;

(6)可及时了解专业发展动态;

(7)可与信息出版商形成信息互动。

3.查新检索服务

科技查新服务(以下简称“查新”)是为了避免科研项目的重复研究,以及客观地判别科技成果的新颖性、先进性而开展的一项工作。根据有关规定,凡国家、省、部、市、地等各级科研项目的开题立项、成果鉴定、申报奖励、新产品开发以及专利申请等,均需要进行查新。查新针对某一特定课题进行,其结果是为被查课题出具一份“查新报告”。在整个科技查新过程中,查新检索是一个重要环节。

查新是指具有查新业务资质的查新机构,根据查新委托人提供的需要,查证其新颖性的科学技术内容,按照《科技查新规范》(国科发计字[2000]544号)进行操作,并做出结论(查新报告)。

科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报审查,写出有依据、有分析、有对比、有结论的查新报告。查新是以通过检出文献的客观事实来对项目的新颖性做出结论。查新有较严格的年限、范围和程序规定,有查全、查准的严格要求,要求给出明确的结论。查新结论具有客观性和鉴证性,但不是全面的成果评审结论,这些都是单纯的文献检索所不具备,也有别于专家评审。

查新的对象主要包括:申报国家级或省(部)级科学技术奖励的人或机构;申报各级各类科技计划,各种基金项目、新产品开发计划的人或机构;各级成果的鉴定、验收、评估、转化;科研项目开题立项;技术引进;国家和地方有关规定要求查新的项目。

(1)科技查新性质。

科技查新的性质首先表现在对新颖性的审查。科学技术是探索性和创新性工作,它的灵魂在于创新。如果一个科研课题没有新颖性,那么,立题论证其“需要性”、“可行性”或在成果鉴定时评价其“先进性”、“实用性”都将失去现实意义。科技查新首先是要审查该项目或课题在国内外有没有人做过,是否有相同或类似的研究,以避免科研工作重复或走弯路,避免人力、物力和财力的浪费。

科技查新也要对课题或项目的实用性和先进性进行审查。特别对于工程技术、农业技术、大型设备的实用性和先进性,要进行认真分析和评价。在科技查新工作开展的初期,比较注意对项目新颖性的审查和评价,随着查新工作的深入,提出了对项目实用性和先进性的综合评价,或称“三性论证”,这是对查新工作提出的更高要求。

科技查新咨询不同于一般的咨询。一般咨询只提供有关的文献线索,不对课题进行分析、研究和对比。科技查新也不同于一般的文献检索。一般的文献检索只是根据课题查找一些光盘或数据库,帮助找到所需文献,不对课题做出评价。

科技查新是一项要求高、难度大及高层次的文献检索服务工作。

(2)科技查新的程序。

科技查新工作的程序包括4个步骤:接受课题、文献检索、分析对比、撰写查新报告。

接受课题是查新工作的第一步,也是确保查新工作质量的基础。首先要求用户填写科技查新委托书,内容包括:查新目的、查询范围、查新课题的主要内容、关键技术(主要工艺、结构特点、原材料、研究方法、结论等)、主要性能指标、主要用途、创新点等,以便做到心中有数,有的放矢。查新课题委托书的填写既要全面,又要简明扼要。专业性较强的查新课题,应有与该专业较接近的查新人员协助接待。接受课题后,应对课题进行分析、理解。分析课题是查新人员判断课题的研究目的与研究内容,找出该课题的新思想、新见解、新方法所在之处,以确定查新重点,为新颖性审查的具体对象进行分析。

进行文献检索前,首先要确定该查新课题所应使用的关键词、主题词和分类号,并根据查新重点确定检索服务,然后进行检索。查全率是文献检索的核心,因为新颖性的审查就是要回答国内外有没有与该课题相同或类似的文献报告。

分析对比,是指从检索命中的文献中,选择最重要的相关文献,与该课题提出的新思想、新见解、新认识进行异同比较,主要的相关文献较多时,可将文献分成几类,分类论述。也可进行综合分析,分析对比文献时,要针对课题的主要技术内容、技术特点、技术指标进行分析,以审查该课题是否有实质性的创新,研究的深度、广度如何,主要技术指标处于什么水平,通过相关的文献对比,查新结论就比较明确了。

查新报告是查新工作的最终体现。查新报告由下列几部分组成:封面:项目主要内容说明和查新要求;国内外文献检索范围,时限和情况;检索结果说明和查新结论。

文献检索情况应包括:检索词、分类号、检索刊物和数据库名称以及查到的文献情况等。最好用表格形式体现出来。

(3)NoteExpress在查新工作中的应用。

NoteExpress(以下简称“NE”)是北京爱琴海软件公司开发的、符合国内用户需求的专业文献检索与管理系统。NE可以通过各种途径自动搜索在线数据库,下载、管理文献资料和论文,其最具特色的功能是能方便导入许多中文文献数据库,如维普、万方、CNKI、CBM的参考文献。科技查新就是要检索和处理大量的文献。浙江大学图书馆川蓉尝试着利用NE查新,取得显著成效,把原来查新报告撰写过程中最机械、重复性高、费时多的文件格式处理过程,简化成在检索数据库的同时轻点几下鼠标就能瞬间完成。通过对NE各功能的学习以及制作NE相关样式和过滤器的尝试,目前已成功实现将维普、中国知网、万方、中国生物医学文献数据库、中国专利信息网、ISI Web of Knowledge、Ei Village、PubMed中涉及的期刊、会议、学位论文、专利4种类型的文献题录通过NE转换成我们规定的著录格式。

查新结论是查新工作的核心,应体现出查新的内涵。查新是以该课题的创新点为论点,以对有关文献的分析比较为论据,来论证该课题是否有新颖性。查新结论一定要客观,具体、实事求是,不能加个人的观点和意见。

4.浏览式检索服务

浏览式检索服务是图书馆顺应信息技术的发展和用户检索习惯的改变而进行的检索界面的改造,主要用于图书馆联机公共目录查询系统中。

浏览式检索服务是符合人类思考习惯的一种检索方式,人们根据自己的阅读爱好和兴趣选择文献,在阅读浏览的过程中发现问题或对所感兴趣的问题有大致的了解。数字时代更为“浏览式检索”提供了便利条件,超文本和多媒体的信息组织方式使用户在信息检索中如鱼得水,在浏览的过程中发现兴趣所在。浏览式检索符合用户的立体思维方式,因而在图书馆得到普遍使用。

浏览式检索服务较多应用在书目检索、数据库检索和主题检索中。

书目检索中的分类途径是浏览式检索常用的。按照索书号,读者可以在索书号前后位置浏览,以便了解某类的有关文献。此外,书名、著者、ISBN也可用于浏览式检索。

数据库检索中刊名的检索应用浏览式较多,对一期刊物的内容按实际出版情况展现给用户,方便用户对此刊内容阅览。如万方数据库资源检索系统的数字化期刊检索中,可以将某刊中的某一期原有内容提供给用户,方便用户对此刊特色、文献内容的了解。

主题检索中主要是将主题提供给用户,方便用户选择。如美国国会图书馆书目检索系统中的主题词浏览,将相关上下位类的主题词集中在一起提供给用户,帮助用户选词,以提高检索效率。

综上所述,浏览式信息检索服务的定义可以归纳为:根据用户的思维方式和阅读习惯,浏览式检索将某专题、某主题词或某一载体的文献,立体地呈现给用户,帮助用户理解此主题或专题的含义或相关的信息、资料。

浏览式检索服务由于将信息技术与用户的检索习惯结合起来,它具有以下特点:

(1)为用户集中相关的文献、信息。浏览式检索实际是将相关的文献、信息集中起来为用户服务,是一个相关的文献信息集合。

(2)帮助用户确定所需要的文献和信息。用户在检索时,很多时候对自己的需求并不是非常明确,在浏览的过程中通过了解相关的信息与资料,可能会确定自己的需求。

(3)符合用户思考时的规律。浏览式信息检索延伸了用户思维的时间和空间范围,立体地架构了用户思维时的信息空间。

5.跨库检索服务

图书馆信息资源的构成多样化,不仅有自己建设的馆藏书目数据库,也有购买的数据库。这些异构的数据库信息组织、信息服务、结果处理等方式各不相同,数据库标准和结构具有很大的差异性。在检索时必须了解各个数据库的使用方法和限制,利用不同的工具和协议。这给用户利用信息资源带来了极大的不便。为了通过网络为用户提供信息服务,实现更高层次的信息描述,需要跨领域、跨数据库把用户所关心的相关主题信息集中地检索和显示出来,跨库检索服务应运而生。

跨库检索,也称联邦检索或多数据库检索或集成检索,是以多个分布式异构数据源为对象的检索系统。这种系统向用户提供统一的检索接口,能够把用户的检索要求转化为不同数据源的检索表达式,并发地检索本地和广域网上的多个分布式异构数据源,并对检索结果加以整合,在去除重复和重新排序之后,以统一的格式将信息呈现给用户。跨库检索的这种基本原理,决定了它有以下优点:①提供统一的检索接口,能够减轻用户要熟悉不同数据库检索方法的负担;②并发检索能够节省用户查找资料的时间;③检索结果整合,呈现给用户的最终结果不仅格式统一,而且按统一标准排序,大大方便了用户的浏览和选择;④有些跨库检索系统还能够将检索结果直接链接到图书馆拥有的全文文献,实现了文献信息即索即得。

(1)国外的跨库检索系统。

20世纪90年代后期,美国开始研究跨库检索问题,并相继开发一些能够同步检索图书馆的书目数据库和全文数据库的软件。

①Flash Point系统:

于2000年4月推出1.0版,目前已开发4.0版。该系统最初只能检索本地安装的8个数据库,仅提供简单检索界面。经过多次升级,跨库检索的数量增加到10多个,除了本地安装的数据库外,还包括网络数据库、网络版电子期刊、图书馆书目,可以满足中小型图书馆的需要。Flash Point的主要特点是:

a.提供主题检索途径(Sub-iect Approach),允许用户在检索之前指定要检索的学科领域,而不必指定哪个特定的数据库,系统会按照指定的学科自动地选择相关的数据库进行检索,以提高检索速度。

b.I.ANL.过滤(I.AM.Filter)功能,利用这种功能,用户通过点击“IANL.过滤”按钮,就可以检索出指定主题范围内IANL.发表或与I.AM.有关的文献。

c.提供“检索进程”界面。用户提高了检索需求之后,系统向用户提供“检索进程”界面,以表示检索的进展情况,该界面大约每隔10秒钟更新一次,直至结果界面出现。

②SearchLight系统:

美国加利福尼亚大学的数字图书馆项目,于1999年1月正式提供服务。它能够支持图书馆书目数据库分布式检索的Z39.50协议和Web搜索,可以跨库检索55个数据源。包括商业数据库、图书馆的自建数据库、电子期刊等。与其他系统相比,SearchLight具有以下主要的功能和特点:

检索结果没有统一排序和统一呈现的功能,而是分别在图书、期刊论文索引、电子期刊、全文资源、参考资源和Web目录这6个数据源范畴下按字顺显示检索的结果。用户查看详细的文献内容时,需点击相应的数据源范畴进入具体的信息源;必要时,还需要在首次检索的数据源中重新进行二次检索。

资源选择界面不是将所有跨库检索的数据库都罗列出来由用户选择,而是提供一个二级分类体系,每个数据源都根据它的信息内容分到相应的类目下(可以多重分类,一个数据源里如果有多种内容的文献资料,就按情况将这个数据源分到不同的类目下),用户检索时不必关心要检索哪一个具体的数据源,只要选中相应类目前的检查框(Ckeckbox)并输入关键词即可检索到相应的结果。这种组织方式的优点是符合用户检索习惯。

能够显示检索进程。用户开始检索之后,系统按秒显示出检索时间,直至用户设定的超过时间或检索完毕。在这个过程中,允许用户中断检索并查看已检出部分的记录。

③MetaLib系统:

它不仅是提供跨库检索的信息门户,也是一个图书馆多类型混合资源的管理平台,它可以检索100个以上数字资源。基于MetaLib系统,读者可以交叉检索(cross-search)和利用不同类型的数字资源,还可以定制个性化信息服务,更有效地开展研究工作。基于MetaLib系统,图书馆可以管理多类型的混合资源,无论是本地资源还是远程资源,无论是免费使用还是授权使用资源。图书馆通过配置和管理本地化的MetaLib知识库实现对分布环境下异构平台资源的管理,包括书目信息、参考数据库、电子期刊、数字储藏以及主题网关等。

MetaLib可实现的功能有:

a.按主题检索数据库,并组织资源做主题导航;

b.针对作者、题名、主题和关键词进行跨库检索,一次可以同时检索不同数字平台的8个数据库;

c.同时检索图书馆联盟的各个图书馆的书目数据库和数字资源;

d.为读者定制和保存个人最相关的资源,保存已有的检索结果,并且在需要的时候重新运行;

e.整合图书馆的电子图书、电子期刊等多种资源,可以即查即得。

(2)国内的跨库检索系统。

①国家科技图书文献中心(NSTL):

国家科技图书文献中心是由科技部牵头组织实施的虚拟国家科技图书馆,通过中心的网络服务系统向全国用户提供科技文献检索、电子全文服务,以及由8个参建单位(中国科技信息研究所、中国科学院图书馆、中国农业科学院科技文献中心、中国医学科学院图书馆、中国化工信息中心、机械工业信息研究院、冶金工业信息研究院、中国标准研究中心)共同支持的全文传递服务。该中心有40个自建的文献数据库,数据总量达3900多万条,包括图书、期刊、会议论文、学位论文、科技报告、专刊和标准,涉及中、英、日、俄四种语言文字。这些文献分别收藏在8个参建单位的图书馆。国家科技图书文献中心的网络服务界面上提供跨数据库检索功能:

a.可一次检索单一语种的多个数据库,如中文的期刊目次、学位论文、会议论文、科技报告等;

b.可按内容分类检索多个数据库,如农业科学、生物科学、环境科学等;

c.可在8个参建图书馆中选择、检索选中的图书馆馆藏期刊、论文等文献的标题、作者、文摘、关键词等;

d.可选择数据库的所有年限或将年份限定在具体的某一年。

②中国科学院文献情报中心跨库检索系统:

于2004年提供服务。可以跨库检索近100个数据源,能够支持图书馆书目数据库跨库分布式检索Z39.50协议和互联网搜索,包括全文数据库、文摘和索引数据库、图书馆自建数据库和搜索门户网站。该系统的主要功能和特点是:

a.可按内容分类检索多个数据库,如生物、天文、物理、医学等;

b.可一次检索多语种的多个数据库,如中英文的全文期刊、中英文的学位论文等;

c.可检索不同类型的数据源,如全文数据库、文摘和索引数据库、百度和雅虎搜索门户、图书馆自建数据库等;

d.可一次检索国内外40多个图书馆的馆藏书目数据库;

e.文摘和索引的检索结果中有全文的可以链接全文,没有全文可以链接全文传递系统;

f.系统显示检索的过程并提供信息资源的多种应用统计。

③中国高等教育文献保障系统:

中国高等教育文献保障系统(CALIS)统一检索软件,能够对100多个国内外电子资源数据库进行整合,为用户提供更好的整合检索服务,提高信息资源的利用率。统一检索软件采用了新型的基于元数据的检索技术,能够对分布在本地和异地的各种异构资源提供统一的检索界面和检索语言。检索的资源类型包括全文、图片、引文、文摘、馆藏书目等,统一的检索软件提供多种检索方式,包括简单检索、高级检索、二次检索等,支持多种检索运祘符,并且能够对各种信息资源的访问进行限制、监控、统计、计费等处理。还为用户提供“我的学科”、“我的收藏夹”、“我的检索历史”等个性化检索服务。该系统的主要功能和特点是:

a.可按内容分类进行跨数据库检索,如生物、天文、物理、医学等;

b.可选择检索不同语种的多个数据库,如中英文的全文期刊、中英文的会议论文等;

c.可检索不同类型的数据源,如全文数据库、文摘和索引数据库、图书馆自建数据库等;

d.文摘和索引的检索结果中有全文的可以链接全文;

e.系统提供个性化服务,为用户保存个人所关注的学科、资源、文献和检索历史;

f.系统可控制和统计用户访问图书馆,保存统计数据。

④CNKI跨库检索:

其核心KNS5.0检索服务器可以实现在清华同方各大数据库产品的跨库检索,多数据库实现了统一跨库检索,用户能够在一个界面下完成所有数据库的检索,省却了多个库逐一登录、逐一检索的麻烦,检索过程简单、快捷,检索界面格式统一,减轻用户的学习负担。

清华同方各大数据库跨库检索的目前实现了如下功能:库间引文链接;检索词历史记录;概念关系词典;知识网络系统;知识网络中心;知识元链接;引文链接;相似文献链接;读者推荐文献;智能检索;集群服务。

清华同方的跨库检索是目前国内做得最全,也是功能较多的,不足之处是只局限于清华同方系统,另外,它的数据库是基于MS SQL Server2000开发的,当数据量很大时,镜像站点的数据索引更新常常会导随致网络存储停止响应。

⑤随易通CSDL跨库检索:

随易通CSDL跨库检索:由中国科学院国家科学数字图书馆主办,目前有80家单位参与。使用CSDL开通的网络数据库http:/cross.csdl.ac.cn/metasearch/jsp/index.jsp,建立区域性分布式海量存储体系,实现本地区电子出版物的网络共享。

该系统是一个用于同时调用多个数据库和搜索引擎进行资料检索的软件系统,也称“跨库检索系统”,它可以帮助用户同时在多个数据库中进行检索,并同时得到多个数据库的结果,避免了需要逐个登录数据库、输入检索条件的麻烦,使用方便、快捷。随易通CSDL跨库检索系统相对使用范围较大,技术也较成熟,具体研发时值得借鉴。

6.知识检索

所谓知识检索,就是应用先进的智能理论及其技术,对信息资源和用户提问进行一系列的语义解析,通过挖掘其深层含义,从而充分、精确地表达知识资源和用户需求,进而在各类异构的数据库、数据仓库、知识库中进行检索,并对检索到的信息进行智能化处理之后,返回最相关结果的检索机制。

知识检索是具有传统信息检索模式无法比拟的优势和功能的一种高级检索方法,代表着信息检索的未来发展方向,在对读者用户提供的自由词语义分析上,表现出十分强大的推理、诠释和学习能力,它通过突出的智能性功能优势的发挥,能根据用户对于数字出版物的题名、文摘、类号、主题词、目录、版权、页次、正文等任何信息项、知识点需求提问,自动、快速、聪慧地作出判断分析和数据提取,即以出色的自然语言理解能力,对读者用户提交关于数字出版物任何内容需求的任意自由词,皆能精准、敏捷地切合用户的需求意图,提供一种所谓傻瓜型的检索。因而,数字出版物运用知识检索机制,不仅能基本上满足读者对于数字产品和服务的多样化、个性化知识、信息内容需求,还能解决检索服务的一站式搜索机制难题,并以智能化、高级化的知识检索技术,提升人性化服务水平。

7.信息门户服务

(1)学科信息门户。

学科信息门户(Subject Information Gateway,SIG),指的是将特定学科领域的信息资源,工具和服务集成为整体,为用户提供方便的信息检索和服务入口。学科信息门户中的信息经过鉴定和选择,是用户获取有价值网络学科信息的重要入口点,是图书馆界借用商业信息门户概念和技术,并结合文献信息处理的传统经验,解决通用信息门户难以适应网络学科信息组织和利用问题的结果。

学科信息门户按照某学科(专题)用户的要求对网络中相关的信息资源通过人工选择和标引数据,存储的信息通常少而精,保证了信息的质量,使分类浏览的结构更为方便。在给用户“指路”的同时提供更专门、更精深的信息检索服务,有助于专业用户在本领域的“信息超市”(information supermarket)中选择高质量的资源和获得“一站式检索”(one sit search),从而保证用户获“所得即所要”的信息。其特点有:

①学科领域的清晰表达,定义了学科信息门户应该包含哪些内容。这些内容有关学科领域的相关文章,或者是相关站点和文档的链接。用户可以方便地查阅这些信息和其他相关内容,其本身并没有学科领域深层的内容。

②在选择存储信息方面,定义明确的质量评价体系。所有的门户都有一些明确保证信息质量的指标,它们决定了哪些信息需要收录、哪些信息会被舍弃。这些指标从细节方面正式和客观的,到大纲方面非正式和主观的变化显著。当今建立一个普遍接受的指标体系的趋势愈来愈明显,而且有些已经被学科信息门户确立为事实的标准。

③智能的产生包括注解和评价在内的内容描述信息。描述信息在不同的门户之间具有不同的形式,可以是相当简短的注解,还可以是广博的摘要。这些门户总是很小心的避免使用由搜索引擎自动产生的文件摘要。

④提供信息分类和主题索引。

⑤提供先进的检索工具,既支持传统的基于数据库的字段检索、截断检索等,还支持在主题词表、后控词表支持下的智能检索。

学科信息门户经历了不断发展变化的若干形式,目前主要可分为以下五个类型。

①以网络学科信息导航为主的学科信息门户,通过权威、可靠、规范和可持续的网络信息资源选择、描述和检索,成为相关学科领域的核心和可信赖的信息门户。

②以专业机构或图书情报服务系统为基础的信息门户,根据专业机构性质或其他信息服务需求,各类资源(包括网络资源、数据库、文件系统、知识库、指南手册等)组合在统一门户下向用户提供服务,其中部分门户可支持横向整合检索、参考文献链接、用户虚拟社区等功能。

③基于跨学科门户检索的学科用户系统,支持多个学科信息门户之间的整合检索。

④基于门户体系的数字信息服务机制,将多个分布门户(主要是学科信息门户)作为整个数字信息资源的整合机制和服务渠道,让用户通过门户体系方便地搜寻、调用和利用各种不同的信息资源和服务。

⑤开放数字信息服务机制,不但支持基于学科信息门户的资源与服务集成,还进一步支持按照用户个性化需要定制信息门户,根据逻辑业务流程整合多个信息服务环节,支持多个信息门户之间的开放集成于定制,这方面的技术包括open digital library,open linking和open metadata机制,而且基于分布Web服务的开发电子商务关键技术(EBXML体系和Web Services机制)也可在开放学科信息门户中得到应用。

学科信息门户的研究和发展在国外一直很活跃,如SOSIG、EELS、BIOME、AVEL、GEOGUIDE、ADAM等都是比较成功的典型。国内在这方面起步晚,动作缓,主要有高校系统的重要学科资源导航系统(如:武汉理工大学图书馆材料复合新技术信息门户)以及中国科学院正在建设中的分布式学科信息门户项目等。纵观这些学科信息门户的建设和运行,可以对学科信息门户进行更精确的表述:它是针对特定学科或主题领域,按照一定的资源选择和评价标准,规范的资源描述和组织体系,对具有一定学术价值的网络资源进行搜集、描述和组织,并提供浏览、检索、导航等增值服务的专门性信息门户。通过采取综合的控制措施,它有效地解决了网络信息资源在体积、检索、质量和可信度等方面存在的突出问题,适应了学科研究本身信息需求的特点,使科研人员可以从一个单一的入口迅速找到所需的信息。它的最新发展方向是向更深层次的信息整合和服务集成,以及支持分布式跨门户的浏览和检索服务支持。

随着时代的进步,当前国内外学科信息门户正在由初具功能的中级阶段向个性化、智能化和高度集成的高级信息门户阶段发展。国内已经开始意识到学科信息门户在提供资源和服务方面的优越性,正在从以下几个方面加强建设:

①制定严格的资源选择标准。只有对资源进行严格的选择,并建立起完整的评价机制,才能保证所提供信息资源的高质量。

②细化资源的分类体系,加强资源的元数据描述。资源的分类及元数据描述对学科信息门户至关重要,它决定了对信息的内容和位置的描述,从而为信息的存取与利用奠定了必要的基础,这样就有利于用户识别资源的价值,发现其真正需要的资源。

③提供方便的信息检索服务。提供用户在使用中完全可以根据自己的需要和这些检索工具的特点来进行选择。

④开展更加精致、人性化、个性化的服务。信息门户必须针对用户的具体需要,在确保所提供信息高质量的同时,利用网络新技术,跟踪用户需求,为用户提供主动的个性化定制服务。

(2)信息门户服务。

信息门户服务是图书馆利用网络技术向用户提供某一学科领域各类网上资源和各种信息的服务。信息门户又称知识门户、语义门户,在英文中多被称Information Portal、Information Gateway、Subject Information Gateway。信息门户针对专业领域整合文献信息资源系统及其检索利用,提供权威、可靠的信息导航,简化门户某一学科及其相关信息的信息查询过程,增加检索结果的有效性,为用户提供经过筛选的各种类型高质量信息资源,实现面向用户的一站式服务。

国外已开发出信息门户的创建工具,例如Imesh软件包和SPT软件包。美国威斯康曼—麦迪逊大学“网络侦察”(Internet Scout Project)项目开发的SPT信息门户软件包(Scout Portal Toolkit),该软件支持GNU的GPL协议,可以免费获得源代码,供用户免费下载安装,具有完备的学科信息门户创建功能,包括对元数据、OAI0、RSS等的支持,可以帮助图书馆员快速构建自己的学科信息门户网站。

(3)国内主要学科信息门户。

①中国科学院国家科学图书馆学科信息门户:

中国科学院国家科学图书馆学科信息门户网站(Subject information gateways)是中科院知识创新试点重大基础设施建设项目的子项目之一,于2001年12月正式启动。是一个把用户信息资源和服务需求有机集成于统一平台的系统。

学科信息门户主要以向科研工作者提供权威和可靠的网络学科资源导航为目标,包含化学、生物科学、环境资源、数理科学、图书情报学等领域5个学科信息门户;微生物、青藏高原、长江流域生态和环境、天然产物和天然药物、科技政策、中国种子植物、新生传染病专题、专利信息、海洋科学、自然科学史等10个特色专业信息门户。面向全院科研人员,通过网络免费提供面向学科专业的最新信息检索服务。其建设目标是为全院科研人员(包括研究生)提供远程访问的信息资源和服务体系。该门户按照学科大类组建,通过学科专家对这些学科内核心、稳定和持续的网上信息资源的分析、选择和整理,为用户提供权威的网络学科资源导航服务。信息门户提供的服务内容:

a.动态信息:业内新闻动态、最新资源推介、留言簿、新闻组、讨论组、信息订阅;

b.资源信息:相关图书、期刊、数据库、软件、视音频资源、主要参考工具、自建数据库、专家和人物信息、会议信息、学术机构信息、研究热点专题信息;

c.导航信息:分类浏览、检索工具、其他相关导航站链接、网站地图、使用帮助。

具体来说,该门户具有以下主要特点:

a.有一个严格的分类体系。在CSDL项目中5个学科信息门户中,都是按照本学科特色,参照相关的国际标准制定的分类。如数理学科信息门户中,物理分类采用的是《国际物理分类法》,它是国际上通用权威的英国INSPEC和德国的Physics Briefs两个物理学文献数据库所采用的分类体系,共十大类;数学分类采用《美国评论》和德国数学文摘采用的《数学主题分类法》,分七大类;资源环境科学信息门户采用了RESC和DDC两种分类体系,将本学科的信息分别分为8类和329类以满足不同用户的信息要求。生命科学学科信息门户在参考中华人民共和国国家标准GB/T13745-92《学科分类与代码》、《中国科学院图书馆图书分类法》(第三版)、《中国图书馆分类法》(第四版)、《Dewey Decimal Classification》(Edition21)等标准和规范的基础上,结合21世纪生命科学学科领域的发展趋势和研究热点,提出的生命科学学科信息门户建设的学科领域覆盖范围。

b.数据量较丰富。用户在检索信息时,都希望能够快捷地收集到更全面的信息,因而学科门户收集数据量的多少,在很大程度上也决定了该门户使用价值的大小,总量上5个学科门户都基本达到并保持在上万条资源,而且资源在不断的更新、增加中,各门户资源总量相对于网络信息资源总量仍然相差很大,需要在保证资源质量的前提下,进一步加快信息资源的加工速度。

c.门户建设单位具有学科优势。学科信息门户以提供权威信息为目标,这些门户的建设均由具有科研实力的研究机构来承担。地域分布以北京、上海和兰州为主,充分利用了各个研究机构的学科优势和地理优势,便于学科信息门户的发展。

d.统一的资源描述标准,都柏林核心(Dublin Core,DC)在门户建设中占据着举足轻重的位置,它是一个由15个元数据(metedete)元素组成的元数据标准,其主要目的是为了促进网络上的资源(包括文本及音像资源)发现。它主要用于描述网络信息资源的基本要素,直接关系着网络信息揭示的深度和广度,要求每条记录用Dublin Core揭示的深度不少于15个核心元素。

②中国高等教育文献保障系统(CALIS)重点学科导航门户:

“重点学科网络资源导航数据”是国家“211”工程中国高等教育文献保障系统(CALIS)“十五”重点建设项目之一。该项目以教育部正式颁布的学科分类系统作为构建导航库的学科分类基础,建立一个集中服务的全球网络资源导航数据库,提供重要学术网站的导航和免费学术资源的导航。CALIS重点学科导航库系统的宗旨是向将因特网中相关重点学科的最优秀的网络资源提供给读者,帮助高校科研人员快速、准确地获取所需要的信息。

受CALIS管理中心的委托,CALIS“十五”期间,“重点学科网络资源导航库”子项目建设由CALIS西北地区中心(西安交通大学图书馆)牵头组织,联合有关高校组成项目管理,负责项目研究分析、软件系统功能设计、软件招投标组织、相关标准的制定、数据质量控制及导航资源建设的管理和协调工作。

经过专家评审,共有52个学校获得导航库参建许可。导航库建设的学科范围涉及除军事学(大类)、民族学(无重点学科)之外的所有一级学科,共78个。经费上获得重点资助的学科48个,一般资助学科13个,非资助学科17个。

目前数据库的建设已完成5000多条记录。建成后记录数不少于62800条。重点学科网络资源导航数据库系统的开发分本地系统和中心系统两部分。目前本地系统的开发已经完成,各参建馆建库已经投入使用。中心系统主要面向读者,用于导航库信息发布。目前已完成初版,基本功能都具备,但页面布局还需调整完善。

其主要内容如下:

a.开发一个网络资源导航库系统平台,包含资源建设、用户服务及资源收集与整理等功能,以实现网络资源的规范搜集、分类、组织和有序化整理,并能对导航信息进行多途径内容揭示。

b.形成相关标准与规范,包括资源选择标准、资源描述标准、导航资源类型标准、软件需求报告、子项目管理规则。

c.建立一个至少覆盖50个一级学科系统的、完整的网络资源学科导航库。每个学科的导航内容应包括支撑学科发展的必备内容和可选内容,应涵盖该学科下所有重点二级学科。平均每个二级学科链接的独立单位资源不少于500个,整个导航库所链接的独立单位资源不少于10万个。

d.建立一个支持子项目可持续发展的机制,包括管理模式、项目运作模式以及系统运作模式。配合CALIS评估子项目,建立本子项目的评估方法,并提供统计数据接口。

③国家科技图书文献中心热点门户:

国家科技图书文献中心热点门户是国家科技图书文献中心组织的一个网络信息资源门户服务栏目,其目标是针对当前国内外普遍关注的科技热点问题,搜集、选择、整理、描述和揭示互联网上与之相关的文献资源、机构信息、动态与新闻,以及专业搜索引擎等,面向广大用户提供国内外主要科技机构和科技信息机构的网站介绍与导航服务,帮助用户从总体上把握各科技热点领域的发展现状、资源特色与信息获取途径。

其门户特点如下:

a.资源范围涉及自然科学中的前沿学科。目前提供服务的热点门户包括以下几个领域:纳米科技、认知科学、食物与营养、艾滋病预防与控制。

b.明确的资源选择原则。科技热点门户网站建设的目标是提供面向研究人员的权威和可靠的精品信息资源导航。其资源选择原则包括:突出重点、兼顾全面、国内要全、国外要精;免费资源与商业资源并存;相关学科与交叉学科信息资源等。

c.资源类型丰富。包括学科研究与发展信息源(日常工具):热点专题数据库、热点专题软件、热点专题期刊与杂志、热点专题相关的图书、专利信息、热点专题文章精选、热点专题图书馆、热点专题相关产品目录及电子商务;热点(动态)及相关信息:热点专题新闻、热点专题会议信息、热点专题相关的讨论组和新闻组、热点专题相关的教学资源(以满足研究人员继续教育与拓宽知识面的需要)、专家数据库地址簿、求职信息;机构信息:热点专题相关的学会组织与机构、研究机构、热点专题相关的实验室和研究小组、热点专题相关的公司;日常工具(信息源知识):主要参考工具、主要的信息提供者、针对一个具体问题的文献查询方法、用户留言;有关资源导航及搜寻工具等。

④空间生命科学与技术信息门户:

中国科学院生命科学与生物技术局主管的《空间生命科学与技术的研究和应用》项目是一个大学科交叉的中国科学院知识创新工程重要方向项目,是国家载人航天工程中空间科学与技术研究进一步发展的前期准备工作之一。为了正确和合理地规划和安排研究,争取使其能在国际上处于先进的水平和位置,充分了解国际上该领域研究的动态。《空间生命科学与技术的研究和应用》项目于2002年12月委托中国科学院上海生命科学信息中心提供《国际空间生命科学与技术研究动态》的文献情报调查服务。由信息中心咨询研究部负责具体文献和情报调查服务工作。

8.网络信息导航

(1)概念、特点。

互联网上的信息复杂多样。互联网本身是一个没有组织的虚拟体,大量有价值的信息散布在信息的海洋中。用户虽然可以通过搜索引擎等网络检索工具查找所需的信息,但由于搜索引擎的商业运作等原因,对信息的反应速度快,但质量及根据用户特定需求对信息利用的整体考虑较弱,利用起来不方便。建立网络信息导航的目的就在于为用户提供特定学科范围或某一主题的网上信息资源的集合,便于用户获取信息,减少他们查找信息的时间,使他们能够更加快捷方便进行信息交流和科学交流。

图书馆网络信息导航指的是在图书馆主页上介绍、分析、评价各种网络信息资源,指导用户有效地利用网络信息资源。

网络信息导航是图书馆根据本馆用户的特点,有针对性收集、整理网上信息、并经过图书馆员的筛选与鉴别。

具有简单的分类体系,有些具备主题检索功能。按学科收集网上丰富的信息资源,集中在信息导航页面上,为用户提供分学科网上信息导航。

网络信息导航通常是一个综合的系统,如高校图书馆根据用户状况和馆藏建立的学术信息导航,包括机构、学会、协会、专家学者、学术期刊、电子期刊等栏目,满足教师、学生等用户的学术信息方面的需求。

网络信息世界是一个多变的世界,信息导航应不断地维护,调整更新内容,适应用户的需要。

(2)网络信息导航的内容及获取。

网络信息导航中信息获取途径一般可分为手工检索与计算机检索两种。

网络信息导航的内容须根据图书馆用户的实际需求来充实。

网络电子期刊是20世纪80年代后期随着学术网络与因特网的建立而出现的通过网络传播的出版物,可分为电子学报、电子快讯、网络电子期刊等类型,大多提供检索手段,现已积累到一定的数量,可成为专业人员进行研究的重要信息源。

学术会议是专业人员互相交流、获取最新研究成果,了解专业最新发展趋势的场所。网络上的学术会议大多是在线会议和学术会议通告。在线会议有时间的限制,但无地点的限制,专业人员可以在规定的时间内参加会议,随时发表自己的见解。学术会议的通告内容有关于会议的时间、地点、主题、议程、注册等,另外在会议进行时有会议通报、会议论文等内容,这些都是重要的学术信息源。

某一专业领域著名的专家学者是专业人员查找信息的重要入口,可以将他们的主页收集起来提供给用户。

学术论坛、聊天室、专业新闻组,相当于传统科学交流中学者之间的对话与讨论,是专业人员抒发思想、灵感等的重要场所。对于此类信息的收集,可以帮助用户了解专业的一些最新发展或动态,用户之间彼此启发思维,使最新的学术信息得以传播。

相关资料,如光盘数据库、网络数据库、统计资料等,对专业人员能够提供强有力的信息支持,对它们的收集可使专业人员有根有据地阐述自己的思想。

搜索引擎,是获取网络信息的主要来源,特别是那些数据量大、内容丰富的综合搜索引擎,是建立学术导航系统中需要着重利用的。如GOOGLE、SOHU、SINA、LYCOS等,所含的专业信息丰富,是网络信息导航系统信息源的首选。另外元搜索引擎等也是选择的对象。

专业期刊,是学术信息的重要来源,目前专业杂志的网络版出现很多,书本式的杂志上都有其网址介绍,这些可以作为搜集的重要内容。

组织机构,包括学会、协会、高等学校、研究机构、管理机构等,是专业信息的集散地,对这些信息的收集是学术导航工作的重要内容。其中学会、协会在米哈依洛夫科学交流理论中被形象地称为“看不见的学院”。

通常情况下,网络信息导航是图书馆主页部分之一,但规模大小不一。

(3)网络信息导航的几种主要方式。

①网络资源导航:

a.运用图书馆学、目录学、索引学、文摘学等先进、成熟的信息处理加工技术,对互联网上有价值的资源按主题进行开发归类,将相关知识信息进行筛选、保存、有效的组织,使之优化,形成满足社会需要的知识集合和体现知识之间相互关联的知识网络,并建立本馆的网络信息资源目录,为读者提供集成化专业信息检索界面,以方便读者检索。

b.信息链接是信息导航最基本的方式。开发网上联机检索系统和专题信息服务系统,把各种数据库的网址和有特色、有价值的网站以及各种中文搜索引擎和具有导航功能的站点汇集起来,并分别进行简要描述,揭示内容特色,供读者选择使用。有条件的应将这些实用网站在本馆网站上做链接,以方便读者使用。

c.为实现资源共享而与国内其他图书馆及国际知名图书馆网址进行链接。

d.开发利用网上免费数据库,并及时推荐给读者。因特网上有许多文献信息可免费查询,这些信息以网站所提供的文献最新目录为主,也有提供全文服务。如因特网上有许多全文期刊,是由出版社、大学、图书馆和科研机构提供的。分布于各个网站上的这些全文期刊,其中一部分是免费的,可供所用网络用户使用。网上还有一些权威部门及政府网站建立的专题数据库、统计数据库等,均可免费查询。

②主题资源导航:

主题资源导航是指按照主题或者专题的形式来组织资源,为用户提供资源的一种信息服务形式。利用主题资源导航,根据用户特定的信息需求,可以以主题树的形式对信息资源进行搜索、组织和整理,提供相应的信息产品与服务。

数字资源的主题导航系统通常建立在专题数据库的基础上,把数字资源体系中与某一或某些相关的节点(网址)进行集中、分类、整理,按照方便用户检索的原则,采用用户熟悉的语言以主题树的形式组织起来,从逻辑上将国内外有关的信息资源联系起来,向用户提供这些资源分布情况,并且通过各种导航手段,为用户方便地定位、迅速获取所需信息资源提供引导,指引用户到特定的地址获取信息。主题导航系统中的信息资源主要采用主题树浏览方式进行组织,需要对信息进行标引、分类、设计主题树的结构等,将信息资源的索引按照主题分级加以组织,用户可以通过逐级浏览的方式,找到所需的信息线索。

主题资源导航在学术、学科领域中应用广泛。20世纪90年代初,国外已经开始建立相关学科或主题的信息导航,90年代中期以后,以主题网关(subject gateway)形式出现的学科信息导航的建设不断涌现,在学科资源主题导航应用中,国外学科主题门户站点对资源的分类通常采用3种形式:通用分类法;单学科分类法;自建分类法。同时这些网站还使用主题词表,提供相关的主题词以提高检索效率。

③现实馆藏导航:

在因特网上建立Web网站,制作自己的馆藏页,揭示本馆馆藏及查询途径、方法等。

a.组织馆藏书目信息上网。

b.介绍特色馆藏文献,并编制文摘、索引等,指引读者选用。

c.开发、利用馆藏资源,建立各种实用数据库、专题数据库,特别是地方性特色数据库,并提供上网服务。公共图书馆大都有自己的馆藏特色,在某些学科领域或某专题方面具有系统、完整的收藏。要有针对性、有重点地将本馆最有利用价值、最有特色的馆藏逐步转化为数字化资源,建立具有本馆馆藏特色的数据库,如馆藏图书、报刊资源的书目数据库,部分图书馆的全文数据库、多媒体数据库等。

d.馆藏电子文献的导航,如电子期刊、电子图书、电子报纸等,指出光盘文献的类目、内容简要、检索途径、检索方法等。

e.新进书刊的报道。

④出版信息导航:

图书馆作为知识、信息的集合体,应当宣传出版信息、组织出版社或书店目录上网。互联网上包含着大量的新书/刊、媒体出版发行和订购信息,开发、传递这些信息有助于读者了解书/刊、媒体出版发行动态,及时订购所需书刊。

(4)信息导航系统评价。

对于一个信息导航系统来说,是否为用户所接受,是否真正成为用户发现知识的利器,以下几方面可以作为评价参巧:①用户界面是否友好;②信息组织是否合理;③数据来源是否全面;④数据的可靠性如何;⑤导航目标是否明确;⑥导航系统维护如何;⑦链接成功率如何等等。此外,还可以通过用户反馈和点击统计软件等途径不断完善信息导航系统,使数字图书馆真正成为用户与信息的桥梁。

(5)信息导航系统发展趋势。

对未来数字图书馆信息导航系统的展望,研究者们认为在以下几方面将有进一步突破:

①对网络信息的组织采取更先进的技术手段。利用和开发网上自动分类标引、自动文摘技术,拷贝各种网站有关资源和内容,尤其是大型或专业门户导航网站相应学科分类目录下的站点条目的内容,然后组织建立索引文档,形成数据库,并有相应的搜索引擎对索引数据库进行检索。

②数字图书馆信息检索技术不断向智能方向发展。检索功能强大,具有全方位检索手段,大大提高检索的准确性和缩短响应的时间;支持多语种,检索界面友好,检索结果格式清晰,网页链接可靠。

③网上自动跟踪和自动漫游技术将逐步完善。利用和开发网络搜索软件自动搜索指定Web站点的网页和多媒体数据,可以从主页和任一页面开始搜索所有网页。

④利用和开发定量分析软件,自动跟踪、统计用户访问的数字图书馆站点情况。统计各站点被下载次数,自动确认用户常用的数字图书馆和用户经常访问的信息,然后在重点信息中心导航库中作为推荐站点并生成相关信息。

9.“看不见的网页”信息检索服务

“看不见的网页”(The Invisible Web)是指搜索引擎商出于自身考虑不愿索引的网络内容,或是因为技术原因普通搜索引擎(popular search engines)无法索引的网络内容。这些“看不见的网页”含有比搜索引擎所能查找到的网页多得多的信息,拥有大量有价值的如专利信息、电话黄页、航班信息、股价、人口统计数据、专业信息等。如何搜索普通搜索引擎的“蜘蛛”、不易检索“看不见”(Invisible Web)、“深层网络”(beep web),已经引起国内外学者和网络搜索爱好者的关注。

“看不见的网页”含有大量有价值的信息,这些信息对用户的重要性是不言而喻的。图书馆在“看不见的网页”检索中作用有两个主要方面:

第一是图书馆员进行“看不见的网页”的收集、选择和整理工作,需要花费大量的时间、精力、人力、物力、财力;

第二是在用户教育中可以加入“看不见的网页”检索的授课内容,传授用户查找的方法和技巧,使用户了解这些信息及获取信息的方法。

Librarians’Index to the Internet(http:∥lii.org∕)等网站,是经过馆员筛选和维护的包括14000多个网站的主题目录,在查询框输入一个宽泛的主题词,加上“and databases”就可以进入相关的Invisible Web资源。如输入检索词“biology and databases”(生物和数据库),就可以找到普通搜索引擎无法索引的有关生物方面的数据库资源。

10.联机检索

联机检索是读者使用微机或终端设备,按规定的指令输入检索词或有关的检索参量,通过国内外通讯网络查询远程的数据库信息源。一般来说,联机系统由三部分组成:主机系统、通讯系统和终端设备;查询国外图书馆和信息机构的数据库系统通常称为国际联机检索,而查询国内图书馆和信息机构的数据库系统通常称为国内联机检索。

图书馆是人类知识的宝库,是人类交流智慧、共享知识的地方,通过联机检索服务,读者足不出户便能够查找国内和世界各地的图书馆目录。

(1)联机检索的特点。

联机检索有两种方式:一是用户在检索中心所在地,通过终端当场检索数据库。二是用户远离检索中心,通过用户终端和远程通信线路与检索中心连接,向中心提问并取得检索结果,称为联机检索。联机检索系统一般为大型的数据库,它主要有以下特点:

①内容广泛。联机系统中信息资源丰富,各种数据库涉及学科范围广泛,如美国DLALOG国际联机检索有600多个数据库,一个数据库有数十万,乃至上千万记录,覆盖时间范围从几年到几十年,并包括多个国际语种。涉及学科范围包括综合性科学、自然科学、应用科学和工艺学、社会科学和人文科学、时事报道和商业经济等。其数据来源于各种不同的图书、报纸、杂志期刊、技术报告、会议论文、专著、专利、标准、报表、目录、手册等载体上的信息。

②报道及时。联机检索系统能及时更新数据库中的信息。如OCLC FirstSearch联机信息检索系统是每周更新,更新时间是周日北京时间15~19点。DLALOG系统汇总CA(化学文摘)、WPI(世界专利索引),每周更新一次,报纸类数据库每日更新,商情类数据库日日更新。

③查找迅速。由于联机的主机运算速度很快,在含有数百万条的数据库中,一条指令几秒钟就可得到响应,检索一个课题一般只需要几分钟至几十分钟。

④检索方便。联机检索系统一般都提供多途径检索入口。对篇名、文摘字段乃至全文提供关键词检索是最简单实用的检索方式。此外还提供多样化检索界面,有命令式检索、菜单式检索、混合式检索,用户只需掌握任一检索方法,就可自由获得资源。

⑤实时性。用户能将个人的提问与系统所储存的信息进行实时的检索,并可立刻看到检索结果,随时修改提问,直到满意为止。

⑥完整性。用户不仅能检索到文献的摘要,还可以检索到文献的全文。

⑦共享性。不仅可以检索到本地的数据库,而且可以与外地,乃至国际联机网络互通有无,实现信息资源共享。

⑧广泛性。由于现代通信网络的发展,用户不再限于系统操作人员,每一个社会成员都可以根据个人的需要直接进行联机操作。

(2)联机检索系统的服务方式。

联机检索系统根据不同的用户需求提供多种信息服务功能,计算机信息检索系统按其服务功能可划分为回溯检索、定题检索、随机问答和联机订购等四种服务方式。

①回溯检索(retrospective searching,RS),主要是指追溯查找过去的信息,帮助用户查找过去几年甚至几十年的文献,使用户一次检索就可以全面了解某一课题在某一段时间中的发展情况。比较适合申请专利的新颖性检索、科研课题的立项或鉴定时的查新、撰写综合性论文以及编写教材时信息的收集等。

②定题检索(selective dissemination of information,SDI),是用户根据检索课题的内容,一次性输入事先确定好的检索提问式保存在检索系统中,检索系统根据数据库更新周期,定期地对保存的检索提问式进行检索,将检索出的最新文献信息提供给用户。定题检索服务的特点是定期性、新颖性和批处理式。即每隔一定时间就某个主题在检索系统中检索一次,检索的都是近期的新数据,成批处理检索提问。

③随机问答。用户直接利用终端检索,检索系统及时提供用户所需的文献信息。

④联机订购。用户通过联机检索得到的结果有全文文献,也有二次文献(题录和文摘等),如果检索结果未能提供全文,可以通过终端联机向图书馆或者出版商订购原始文献的复印件或电子版原文。

(3)国外主要联机检索系统。

自从1946年第一代计算机面世以来,世界各地的信息检索专家们就设想将计算机技术运用到信息检索领域,并相继于20世纪60年代中后期及70年代在世界发达国家建立了几个大的国际检索系统,如Dialog系统,OCLC的FirstSearch系统、ORBIT系统、ESA-IRS(欧航系统)、STN、Lexis-Nexis等,联机检索系统在世界各地拥有了越来越多的用户,在很大程度上满足了用户快速、方便地检索各种信息资料的要求。

①美国Dialog系统:

Dialog学科覆盖面广,涉及学科范围包括综合性科学、自然科学、应用科学和工艺学、社会科学和人文科学、时事报道和商业经济等。其数据来源于各种不同的图书、报纸、杂志期刊、技术报告、会议论文、专著、专利、标准、报表、目录、手册等载体上的信息。其数据库形式包括:文献型(文献的题录和文摘)、数值型(统计表、商业财政数据等)、名录字典型(手册、指南、名录等)、全文型(论文、报告、新闻报道的全文等)四种。有近600个数据库,其中不少是国际权威的学科数据库,如化学文摘(CA)、英国科学文摘(SA)、医学文摘(MEDLINE)、数学文献数据库(MATHSCI)、生物学文摘(BA)、工程索引(EI);以及著名的特种文献数据库、检索数据库,如美国政府报告(NTIS)、科技会议录索引(ISTP)、科学引文索引(SCI)、社会科学引文索引(SSCI)、艺术与人文科学引文索引(AHCI)。通过Dialog还能检索到世界著名的Derwent专利数据库以及《纽约时报》、《华盛顿邮报》、计算机文摘(IAC)等的全文信息。其内容涉及50多个语种和占世界发行总量60%的6万多种期刊。可以为用户提供商业咨询、电子邮政、定题检索、文献订购、数据库选择等多种服务,可以采用菜单式、命令检索、目标检索等检索模式。

②OCLC的FirstSearch国际联机检索系统(也可称“信息第一站”):

OCLC联机计算机图书馆中心是世界上最大的图书馆及信息中心网络,向世界各地的图书馆和用户提供其产品和服务。通过该系统可检索83个数据库(目前中国高校图书馆用户联合购买其中12个库),其中30多个数据库可检索到全文。在FirstSearch的数据库中总计包括11660种期刊的全文和4500多种期刊的电子影像,达1000多万篇全文文章。数据库中收录的内容来自于图书和期刊文章、会议录、工业通告、财政报告、研究发现、图书评论、组织概貌等类型的记录,而且记录中还有文献信息、馆藏地点、索引、目录、全文资料及其他各类信息,每条记录附有世界各地拥有这一原始文献的图书馆名称。这些数据库涉及的主题范围广泛,并且随时更新。如:

ArticleFirst——23519多种期刊的文章索引和目录索引;

ECO——联机电子学术期刊库(只能查到书目信息);

ERIC——教育方面的期刊文章和报告;

GPO——美国政府出版物;

MEDLINE——医学的所有领域,包括牙科和护理的文献;

PapersFirst——国际学术会议论文索引;

Proceedings——国际学术会议录索引;

UnionLists——OCLC成员馆所收藏期刊的联合列表库;

WilsonSelectPlus——科学、人文、教育和工商方面的全文文章;

WorldAlmanac——世界年鉴和重要的参考资源;

WorldCat——世界范围图书、web资源和其他资料的OCLC编目库;

ClasePeriodica——有关科学和人文领域的拉丁美洲期刊索引。

FirstSearch是一个以Web为基础交互式的联机信息检索系统,国内用户用一台微机安装了Web浏览器,且以各种方式联入Internet或OCLC指定的其他远程通讯网的工作站或微机就可进行检索。

OCLC建议的浏览器和软件:

a.使用4.0或以上版本的IE或Netscape浏览器,且支持JavaScript语言;

b.安装Adobe Acrobat Reader3.0、CatchWord's Realpage2.10或更高级软件。

访问方式:

a.通过万维网:访问FirstSearch最有效的方式是通过互联网连接与标准的Web浏览器,如Microsoft IE4.0或Netscape4.0或更高的版本,JavaScript必须启用;如果阅读以PDF格式提供的电子期刊论文或其他文档,则需要Adobe Acrobat Reader3.0或者更高的版本。

b.Z39.50:用户通过Z39.50兼容的系统,执行本地的程序与命令可以访问到First-Search,执行步骤与效率因本地系统的不同而不同。

也可以用自动登录的方法访问。如果自动登录设置正确,用户可以点击本馆相关网页的链接进入信息第一站,绕过登录界面。

c.通过IP地址确认:这一方式很容易设置与维护,只需指定允许访问账号的IP地址即可(目前中国大陆参加CALIS集团采购的单位访问方式主要是IP地址识别方式:访问地址是http://firstsearch.oclc.org/FSIP。也可以用账号进行访问,这种方式不受IP地址的限制,访问地址是http://firstsearch.oclc.org/,缺点是无法有效控制非法IP的访问。如果要设定FirstSearch系统默认是英文界面,访问地址可以设成http://firstsearch.oclc.org/FirstSearchip language=en。这是在基本URL,HTTP://firstsearch.oclc.org/的基础上,加入一个或多个功能选项,从而构成一个能完成FirstSearch某种或某些功能的网址的方法)。

d.通过WebScript自动登录脚本:WebScript是一个免费的CGI(Common Gateway Interface,通过网关接口)应用程序,可以允许机构在不透露认证号和密码的情况下让用户访问到信息第一站。

FirstSearch不仅充分考虑纸本资源书目信息与电子全文、各库间的联机共享,而且通过系统管理模块的Z39.50或是OpenURL设置,将本系统的资源与外部OPAC、各类数据库和服务开放连接,为用户提供书目信息、全文资源以及文献传递、搜索引擎等一站式服务。

③ORBIT系统:

ORBIT系统是世界上唯一能提供英语和法语服务的信息公司,也是世界第四电信公司法国电信集团的子公司。该系统在专利、商标、科技信息等领域具有独特优势,拥有约60个联机数据库资源。该系统目前拥有250个数据库,上亿篇文献,占世界机存文献的25%。该系统在专利、商标、化学、科学技术、商业和新闻等的联机服务,被公认世界领先的联机检索系统。每天24小时提供服务。

④EINS系统:

欧洲信息网络服务中心(European information network service,EINS),总部设在荷兰。定位于科学技术信息领域,它的目标是:“通过一系列互联的信息供应,确保整个欧洲科技信息的可持续应用,为欧洲科技信息市场提供一个强大的在线服务”。因此,EINS专门提供科学技术方面的信息服务,其收录的数据库也都是偏重于科技类,分为宇航空间科学、建筑科学、工程学、运输、环境科学、地质科学、材料、商业、医学与药物学、化学、物理学、社会学、食品科学与技术、健康与安全、人文科学15个门类,共244个数据库。其最有特色的数据库还是航空航天科学方面。

EINS数据库的另一个特点是地域性比较强,较多的收录了欧洲各国和欧洲国际组织的特色数据库,如著名的《法国文献通报》、《玻璃文档》等数据库,这是美国的联机检索系统普遍忽视。EINS的科技数据库有50%是全文库,提供科技论文、会议录、图书和政府报告的详细参照。

⑤STN系统:

国际科学技术网络(the scientific and technical information network international,STN),中心设在德国卡尔斯鲁厄、日本东京和美国哥伦比亚。拥有200多个数据库,包括生物技术、医学、药物学、卫生安全、材料学、化学化工、数学、物理、能源、冶金等,并拥有世界上第一个联机图像数据库,如CAS的化学物质结构图形库和贝尔斯登有机化学大全结构数据库等,该系统拥有其他一些检索系统所没有的特殊资源和检索手段,其化学物质结构图形是世界上最庞大、收录数据最完全的化学物质名称数据库,已收录了1560多万种化学物质名称,每周还要加入15000个新化合物。

STN支持多文档检索,全天24h提供服务,及时提供在线检索帮助。STN具有强大的服务功能,可根据用户的情报需求,预先确定好检索策略,长期保留在STN中,在数据库更新时,根据各数据库更新周期,按检索提问要求将新存贮的有关资料查找出来提供给用户。还可将一个用户的信息通过网络提供给其他用户,使其他用户共享他们感兴趣的问题,这样,其他用户有可能通过STN和该用户进行有关的信息交换。

⑥Lexis–Nexis系统:

由Mead Data Central公司建立的Lexis-Nexis是一个综合性的联机服务系统,包括世界性新闻、社团、财政、工业、立法规章及政府信息源;其信息采用各种报纸、期刊、杂志、公司报告、工业分析、财政数据、政府出版物及其他数据库。这些信息被组织、划分成多个“库”(Library),每个库收录一个主题领域或某种出版物类型。该系统有其特色数据库、专门的检索指令和专门的通讯检索软件及范围广泛的信息服务,所提供的信息服务主要涉及世界及美国的社会新闻、时事等领域,其检索功能较为完善。

Lexis-Nexis大量收录以法律、新闻、商业经济、政府出版物等内容为主的数据库。

其中专为大学、学术机构和个体研究人员服务的“学术大全数据库”(academic universe),内容仍以法律信息、案例、新闻、商业金融信息、政府规章制度为主,亦增加医学保健信息和各类参考资料,包含有期刊、报告、政府出版物、新闻快讯等5200余种出版物,其中约90%有全文或部分全文。

(4)国内主要联机检索系统。

随着互联网的快速发展与普及,用户可免费从网上获取的资源不断丰富,但从检索资源的系统性、完整性、准确性而言,还不能与大的商业性和图书馆联机检索系统相匹敌,目前国内主要联机检查索系统有中国科技信息研究所的万方数据库检索系统、北京文献服务处信息检索系统、化学联机信息中心等。

①万方数据检索系统:

万方数据检索系统,是国内权威的科技与企业综合性联机服务系统,该系统收集了报纸、期刊、图书、研究报告、特种文献、统计资料、政府出版物及数据库等多种载体,涉及科研院所、高等院校、政府机构、社团、企业的多元信息,组织成70多个专题的二次文献和全文数据库。

万方数据检索系统提供单数据库检索和跨数据库检索,网络远程服务和本地镜像服务等多种方式,并且与科技部建立的“国家科技图书文献中心”门户网站建立了紧密联盟。

②北京文献服务处信息检索系统(BDSIRS):

北京文献服务处信息检索系统由北京文献服务处(BDS)开发的,以联机检索信息服务为主,同时进行信息技术应用研究开发。是集数据建库、词表管理、WWW方式检索、客户端检索、用户权限和记账管理等功能于一体的实用化全文信息检索系统。运用该系统,中国工程技术信息网网管中心已将2200万篇文献数据库提供网上检索服务。

BDSIRS的主要特点是:

a.运行于多种操作平台,支持各种主流Unix操作系统和Windows NT操作系统。

b.使用WWW接口的功能实现Web服务器与全文信息检索服务器的连接,为用户在网上提供浏览与检索结合的全文信息服务手段。

c.针对中文语言特点开发的中文处理技术——汉语自动分词和单汉字索引相结合的全文索引与检索技术,极大地缩小索引空间开销,提高了信息的查全、查准率。

d.海量数据的存储、管理技术和超大规模数据库的快速索引和检索技术,在数百万篇文献中查询全文信息可达到秒级响应时间。

e.应用多进程与多线索技术实现信息检索引擎的多任务机制,能同时响应多个用户的并发查询请求。

f.支持中英文混合检索,检索途径多样化:可用字、词、名字、日期、短语甚至句子、段落进行全文检索。实现前缀、后缀或中间字符的通配符检索。实现了中英文互译、同义词等多种扩检方式。还提供多种检索手段,包括外部特征与正文内容的各种逻辑组合检索、布尔运算、位置邻接运算,以及多步检索结果之间的历史组配等。

BDSIRS可为用户提供科技、军事、国防、专利等相关内容的40多个数据库的联机检索。

③化学联机信息中心(chemical online information center,CHOICE):

该联机检索系统在因特网上主要以化工信息网进行检索服务。化工信息网侧重于化工方面的信息报道,其中设有石化报道、化工市场、化工专题、化工科技等栏目,还提供许多免费信息,如化工黄页(提供诸如有关化工方面的政府社团机构、生产企业、贸易公司等详细的地址及联系方式)、化工商务(提供一些产品的展示信息、供求发布、会展消息、企业发布信息等)、化工资源(提供有关化工网站,如无机化工网、石化网、化肥网、国外化工资源等相关网站资源的链接)等。

(5)健康医学导航系统。

美国国立医学图书馆(national library of medicine,NLM)研制开发了当今世界上最有权威性的医学文献数据库检索系统——国际联机医学文献分析与检索(简称MEDLARS)拥有近40个数据库,收录了自1965年以来生物医学书刊中的近2000多万篇文献,除了书目和文献题录外,还有声像资料、化学和毒理学数据、癌症治疗方案及其卫生和健康的信息。该系统在全世界有20多个国际检索中心,4万多个联机用户,是检索功能齐全的世界性健康网络服务体系,其中最常用的数据库有:

①医学文献联机数据库(MEDLINE)是MEDLARS系统中规模最大、使用频率最高的数据库,它收录了1966年以来70多个国家出版的4000多种生物医学核心期刊中刊载的1200多万篇文献的题录,是检索医学文献最权威的数据库,并可以连接到出版商网络站点获取全文和其他相关资源。

②定题检索联机数据库(SDILINE),提供MEDLINE前一个月新增的全部生物医学文献题录和当月出版的《医学索引》中的全部文献题录,以便于对医学领域最新研究进展进行跟踪,确保检索结果的及时性。

③毒理学情报联机数据库(TOXLINE),包括药物和其他化学品的毒理学、药理学、生物化学及生理学作用等方面的资料和数据。来自生物医学期刊、专著、技术报告、学位论文、会议摘要或研究报告等各类材料中的记录。

④艾滋病资料联机数据库(AIDSLINE)收录了自1980年以来的有关艾滋病临床、研究和卫生政策等方面的文献题录,其中包括正在进行的和已经结束的临床实验用药物的研究、正在被评价的化学和生物学制剂的研究、已终止或已结束的艾滋病临床实验用药物的记录。

⑤医学主题词文档(METHVOC)是一个联机生物医学词典,它包含了MEDLARS数据库的全部主题词、副主题词和化学名词,主题词单元记录包括同义词、范畴注释、树状结构号等数据项;副主题词单元记录对副主题词的使用进行了详细的描述,提供给数据库建设时标引文献和用户检索资料时使用。

11.专利检索

专利文献,从狭义上讲是国务院专利行政部门公布的专利说明书和权利要求书;从广义上讲,专利文献还包括说明书摘要、专利公报以及各种检索工具书、与专利有关的法律文献等。目前,世界上绝大部分国家与地区建立了专利制度,并且有许多国家和组织用官方文字出版专利文献。据世界知识产权组织统计,世界上90%~95%的发明在专利文献中可以查到,并且许多发明只能在专利文献中查到。可以说,专利文献几乎记载了人类取得的每一个新技术成果,是最有权威的世界技术百科全书。

专利文献蕴藏着丰富的技术信息、法律信息、经济信息和战略信息。它可以揭示世界技术的发展趋势和分布、反映竞争对手的技术和市场发展动态、揭示科技创新、市场发展的机会和风险、揭示技术引进、技术应用、技术转让的机会和风险。

Internet发展,打破了时间和空间的界限,也为广大的科技人员查找专利信息提供了一种非常便捷的方式。只要拥有一台可以上网的电脑,就可以随时自由地访问各国专利局的网站;同时由于各国专利局的网站基本都是政府资助,所以Internet网上有大量的免费专利信息,甚至包括全部的专利说明书都是免费的,也就是说,通过Internet,科技人员可以足不出户,完全免费获取所需的专利信息。

(1)专利检索预备知识。

①布尔逻辑检索:

检索时,当碰到两个或以上的概念时,就必须要用上布尔逻辑运算。最常用的运算包括逻辑“与”、逻辑“或”和逻辑“非”。

逻辑“与”用and表示,有的网站也可以用“*”表示;但注意用and表示时,词与词之间要空格。检索式“A and B”,表示文献中同时包含检索词A和检索词B的文献才是命中文献,如图7-1所示。

逻辑“或”用or表示,有的网站也可以用“+”表示;检索式“A or B”,表示包含检索词A的文献或者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献,如图7-2所示。

逻辑“非”用not表示,有的网站也可以用“-”表示。检索式“A not B”,表示包含检索词A同时不包含检索词B的文献为命中文献,如图7-3所示。

img7

图7-1 逻辑“与”示意图

img8

图7-2 逻辑“或”示意图

img9

图7-3 逻辑“非”示意图

在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。复合逻辑检索式中,运算优先级别从高至低依次是not、and、or,可以使用括号改变运算次序。

②全文检索与字段检索:

在网上进行全文检索实际上是指在网站的全部内容中进行查找,而不管该网站是否有真正意义的全文存在。实际上,很多网站会有“全文检索”的选项,实际上是指在“全部字段”中进行查找,英文网站与之对应的是“all fields”,美国专利局的quick Search中也有“all fields”选项。

与“全文检索”相对的是针对某个特定字段进行“字段检索”。例如知道某个中国专利的申请号是90103716.8,则应该针对“申请号”字段进行字段检索,即在“申请号”后面的检索框内输入“90103716”;要查找“二汽公司”申请的中国专利,就应该在“申请(专利权)人”后面的检索框内输入“二汽+东风汽车”进行字段检索。

在网上检索专利时,无论是全文检索还是字段检索,每个检索框内既可以输单个的关键词,也可以输入逻辑表达式。

可以选择多个字段进行组合检索,字段之间的关系一般是“逻辑与”。例如要查找“二汽公司”2001—2005年申请的中国专利,可以在“申请(专利权)人”后面的检索框内输入“二汽+东风汽车”,同时在“申请日”后面的检索框内输入“2001+2002+2003+2004+2005”即可,图7-4是在中国国家知识产权局网站检索的示例。

图7-4 检索示例

③关键词检索与IPC检索:

关键词就是输入检索框中的文字或字符,也就是想让系统寻找的东西。关键词检索是最通用的检索方法,但由于语言的千变万化(同义词、同根词、近义词、同概念词等),关键词检索经常会漏掉很多有关的文献。例如简单地用“计算机”作为关键词进行检索,只能检索得到出现了“计算机”这个关键词的文献;如果文献中不是使用“计算机”,而是采用“电脑”这个词,这样的文献在检索时会被漏掉,查不出来。

在检索专利文献时,为了提高查全率,建议采用IPC检索。同一个技术主题,虽然可能有很多相近似的关键词,但其所对应的IPC号却只有一个;因此不管文献中采用哪个关键词,采用该技术主题所对应的唯一IPC号去进行检索,相关专利都可以检索出来。

IPC是国际专利分类号(International Patent Classification)的缩写,是目前唯一国际通用的专利文献分类和检索工具,是检索各国专利共同的钥匙,全世界绝大多数国家都采用。IPC分类表每五年修订一次,自2006年1月1日开始实行第8版。在中国国家知识产权局网站的“文献服务”栏目(httP://www.sipo.gov.cn/sipo/wxfw/)可以免费浏览和下载最新的IPC分类表。

IPC协定规定,国际专利分类法主要是对发明和实用新型专利文献(包括出版的发明专利申请书、发明证书说明书、实用新型说明书和实用证书说明书等)进行分类。对于外观设计专利文献来说,使用国际外观设计分类法(也称为洛迎诺分类法)进行分类。

IPC号的选定步骤可以从《指导词索引》入手,也可以从《使用指南》入手。下面介绍一种简便的IPC选定方法。

第1步:找出几篇文献,利用被检索技术主题的若干已知的关键词进行初步检索,找到若干篇文献,然后阅读这些文献的著录数据。

第2步:找出相关的IPC号,通过阅读初步检索的结果(即找到的几篇专利文献)的著录项目,找出它们所涉及的IPC号,再对照国际专利分类表,找出最相关的IPC号。

在网上进行IPC检索时,应该采用字段检索:把所确定的IPC号填入“IPC”,(如欧洲专利局检索系统的Advanced Search)或“分类号”(如中国专利局的高级检索)后面的检索框中;或者选定“IPC”作为相应的检索字段,如美国专利局的quick search选定International Classification。

一个完整的分类号由代表部、大类、小类、大组或小组的符号构成,例如:

 A     41    B     1     02

 部    大类   小类    大组   小组

Section  Class  Subclass  Group  Subgroup

A——人类生活必需

A41——服装

A41B——衬衣;内衣;婴儿内衣;手帕

A41B 1——衬衣

A41B 1/02——前襟有镶衬物的衬衣

网络检索时,IPC号的输入格式是“部大类小类大组/小组”。可以输入完整的IPC号,例如“A41B 1/02”,这样检索得到的是有关“前襟有镶衬物的衬衣”的专利;

也可以只输入前面一部分IPC号,部(A)、大类(A41)、小类(A41B)或大组(A41B1)均可。输入“A”可以得到全部“人类生活必需”方面的专利、输入“A41”可以得到全部“服装”的专利、输入“A41B”,可以得到“衬衣;内衣;婴儿内衣;手帕”的全部专利、输入“A41B1”可以得到“衬衣”的全部专利。注意有的网站(如美国专利局)IPC号至少要包括“大类”,不允许只输入“部”;只输入部分IPC号时,还必须使用截词符。

④截词检索:

在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数形式,动、名词形式,英美拼法等,所谓截词检索,就是将通配符如“*”、“?”、“%”或“$”等,放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中文献。这样,检索者不必输入完整的检索词。截词方式有多种,按截断的字符数量分,有有限截断和无限截断;按截断的位置分,有后截断、前截断、中间截断。

后截断,是将截词符号放在一个字符串的右方,满足截词符左方所有字符的记录都为命中记录。从性质上讲,这是一种前方一致的检索,例如:coat?,则前4个字符为coat的所有词都满足条件,系统可检出的词汇有:

coat名词(涂料),动词(涂覆)coating名词,现在分词

coats名词复数coatings

coated过去分词,形容词

可以看出,截词检索具有隐含的OR运算特性,“MARKET*”相当于“1 OR 2 OR 3 OR 4 0R 5”。其他使用场合如年代(199?)、同根词、作者(李$)等。

前截断,是将截词符放在一个字符串的左方,表示其右的有限或无限个字符不影响该字符串的检索,或者说这是一种后方一致检索,对汉语中的复合词组的检索非常方便。前截断和后截断可以结合使用,即中间一致检索。

所谓有限截词,是在检索词后截去有限的字母,例如输入“computer”,表示“?”可以有0~1个字母变化,系统即检出带有computer和computers的文献;输入“stud????”,表示截三个字母,可检索出带有study,studies,Studied和Studing等的文献。无限截词是在检索词根后加一个“?”,表示该词后带任意字母的词都需要,如输入“comput?”则可检出含有Computers,Computing,computered等的文献。

在Internet网上进行免费检索时,很多网站都支持无限截断,各种截断位置均可(后截断、前截断、中间截断)。但不同的网站所采用的通配(截词)符不同,常用的是“*”、“?”、“%”或“$”中的一个。对于不熟悉的网站,可以分别用以上4个去进行试验。

在有些时候,截词符的使用可能会起到至关重要的作用。例如已知一个世界专利的公开是WO2000-00416,需要获取该专利的详细信息。如果采取图7-5所示的输入方法检索结果为零:

img11

图7-5 检索方法1

检索结果为0,1。查询条件或查询词与数据库收录的文献不匹配。

如果引入截词符,则可以查到该专利(图7-6)。

img12

图7-6 检索方法2

原因分析:在该网站的数据库中,专利公开号所采用的写法是“WO0000046lA1”,除了有数字,含包括表示出版(公开)时状态的字母代码“Al”;而计算机在进行字段检索时,是把输入的词(WO00000461)与数据库中的词(WO00000461A1)进行精确匹配的,所以输入“WO00000461”的检索结果是零;而在引入截词符“$”后,则只要前面是“WO00000461”的就可以被检索出来,就包括了“WO0000046lA1”这种情况,因此可以得到检索结果。

有时可能需要后截断、前截断同时采用。例如以上“WO2000—00416”的例子:对于专利公开号中的顺序号“416”,有的网站规定采用5位数,有的网站规定采用6位数;如果网站采用的是5位数,检索时即使输入“WO00000461$”检索结果也为零,因为中间多了一个“0”(网站数据库中的写法是WO00000461);在不清楚网站是采用哪种写法的情况下,可以输入“WO00$461$”,这样虽然检索结果可能会多一些,但绝对不会出现检索结果为零的情况。

因此,截词符在网络检索时是非常有用的,在某些已掌握信息不是非常确切的情况下,不加截词符检索结果可能是零,如果加上截词符,可能就可以查到所需要的东西了。因此,应该学会充分利用截词符。

⑤号码检索:

号码检索(Number Search)是经常采用的一种专利检索方法,但由于一项专利从申请到授权过程中会产生一系列相关的号码,因此在采用Number Search检索专利时,一个非常重要的问题是首先要判断已知的号码属于哪种专利号,然后才能选择所对应的字段进行字段检索(在所对应字段后的检索框内输入号码)。

世界各国与专利有关的号码见表7-1。

表7-1 世界各国与专利有关的号码

img13

注:申请号(Application Number)——专利在申请时所给予的号;

公开号(Publication Number)——专利申请说明书在出版时所给予的号;

授权公告号——专利授权后,出版授权文本时所给予的号;

专利号(Patcnt Number)——专利授权后,专利证书上记载的号;

优先权号(Priority Number)——享有优先权的专利,第一次申请专利的信息。

在网络检索时,公开号(Publication Number)是使用最多的一种号码,因为很多情况下是从别的文献上获取到某项专利的号码后去网上查找该专利的详细信息,而这个在文献上获得的号码一般来说应该是公开号(Publication Number)。公开号(Publication Number)由国别代码(2个大写英文字母)、数字及表示公开级别的字母组成。

不同的国家对各种形式的专利号码有自己的编号方法。

a.中国专利编号体系:

在中国专利文献的查阅和使用过程中,人们经常遇到一个困惑不解的问题,这就是令人眼花缭乱的中国专利说明书编号体系。实际上,该体系包括六种文献号,即:

申请号——在提交专利申请时给出的编号;

专利号——在授予专利权时给出的编号;

公开号——对发明专利申请公开说明书的编号;

审定号——对发明专利申请审定说明书的编号;

公告号——对实用新型专利申请说明书的编号、对公告的外观设计专利申请的编号;

授权公告号——对发明专利说明书的编号、对实用新型专利说明书的编号、对公告的外观设计专利的编号。

中国专利说明书的编号体系由于1989年和1993年的两次调整而分为三个阶段: 1985—1988年为第一阶段,1989—1992年为第二阶段,1993年以后为第三阶段,举例说明见表7-2。

表7-2 1985—1988年的中国专利编号体系

img14

此阶段的编号特点如下:

第一,三种专利申请号由8位数字组成,按年编排。如88100001,前两位数字表示申请年代,第三位数字表示专利权种类(1——发明、2——实用新型、3——外观设计),后五位数字表示当年申请顺序号。

第二,一号多用,所有文献号沿用申请号。专利号前的ZL为汉语“专利”的声母组合,一般用在专利公报或检索工具中。

共用一套号码的编号方式,突出的优点是方便查阅,易于检索。不足之处是:由于专利审查过程中的撤回、驳回、修改或补正,使申请文件不可能全部公开或按申请号的顺序依次公开,从而造成文献的缺号和跳号(号码不连贯)现象,给文献的收藏与管理带来诸多不便。因此,1989年中国专利文献编号体系做了调整,举例说明见表7-3。

表7-3 1989—1992年的中国专利编号体系

此阶段的编号特点如下:

一是自1989年开始出版的专利文献中,三种专利申请号由9位数字组成,按年编排。如89103229.2,增加小数点后面的计算机校验码,其他含义不变。

二是自1989年开始出版的所有专利说明书文献号均由7位数字组成,按各自流水号序列顺排,逐年累计。起始号分别为:

发明专利申请公开号自CNl030001A开始;

发明专利申请审定号自CN1003001B开始;

实用新型申请公告号自CN2O30001U开始;

外观设计申请公告号自CN300300IS开始。

首位数字表示专利权种类:1——发明,2——实用新型,3——外观设计。

1993年1月1日起,实施修改后的专利法,中国专利文献编号体系又有新变化,举例说明见表7-4。

表7-4 1993年后的中国专利编号体系

img16

此阶段的编号特点如下:

一是自1994年起,发明专利申请号后五位申请顺序号中,以8和9打头的,如94190001.0表示指定中国的国际申请,其他含义不变。

二是自1993年开始出版的发明专利说明书、实用新型专利说明书、外观设计专利权授予编号都称为授权公告号,分别延续原审定号或原公告号序列,文献类型识别代码相应改为C、Y、D。

此外,对确定为保密的发明专利申请和实用新型专利申请,授权后解密的,出版解密的发明或实用新型专利说明书,同时在专利公报上予以公告。解密专利说明书的编号,对发明专利申请公开号的表示,如解密CN1××××××C;对实用新型专利申请公告号的表示,如解密CN2××××××Y。

2003年10月1日开始,专利申请号采取了新的形式,见表7-5。2004年7月1日开始的专利文献号见表7-6、表7-7和表7-8。

表7-5 2003年10月1日开始的中国专利申请号形式

表7-6 2004年7月1日开始的发明专利文献号

img18

表7-7 2004年7月1日开始的实用新型专利文献号

img19

表7-8 2004年7月1日开始的外观设计专利文献号

img20

b.美国专利编号(表7-9、表7-10):

表7-9 2001年以前的美国专利编号

img21

表7-10 2001年以后的美国专利编号

img22

c.欧洲专利编号(表7-11):

表7-11 欧洲专利编号

img23

d.日本专利编号(表7-12、表7-13):

表7-12 日本特许(专利)说明书1996年前出版及编号情况

img24

表7-13 日本特许(专利)说明书1996年后出版及编号情况

img25

e.德国专利编号(表7-14、表7-15):

表7-14 1995年以前专利编号系统

img26

表7-15 1995年以后专利编号系统

img27

⑥国际专利申请编号(表7-16):

表7-16 国际专利申请编号

img28

⑥人名与公司名检索:

已知人名或公司名,欲检索相应的专利信息,应该分别对应“发明(设计)人”和“申请(专利权)人”字段进行字段检索。对应的英文分别为“Inventor(s)”和“Applicant(s)”。

例如:已知发明人为吴学仁,应在“发明(设计)人”后的检索框内填入“吴学仁”;要查找dupont申请的专利,应在“Applicant(s)”后的检索框内填入“dupont”。

发明(设计)人一般均为自然人;而申请(专利权)人国外一般均为公司,中国既有公司,也有自然人。

在检索某个公司的专利时,为了避免漏检,应该考虑该公司是否还有子公司、下属公司、是否有曾用名。应该把有可能采用的公司名称都作为检索词,进行“逻辑或”运算,必要时,还可以使用截词符。例如要检索“二汽”申请的中国专利,利用中国国家知识产权局网上的检索系统,在“发明(设计)人”后的检索框内输入“二汽+东风汽车”,这样申请(专利权)人中包括“二汽”或包括“东风汽车”的专利都可以查出来,共82条发明专利(检索日期:2007-01-18)。申请(专利权)人包括“东风汽车公司茅箭医院”(下属单位)、“东风汽车公司”、“第二汽车制造厂”、“深圳东风汽车公司”(分公司)、“东风汽车车轮有限公司随州车轮厂”(下属厂)、“东风汽车有限公司工艺研究所”(下属研究所)、“东风汽车有限公司”(子公司)、“上海二汽公共交通公司”(属于不正确的检索结果,应该排除)、“东风汽车紧固件有限公司”(子公司)、“东风汽车悬架弹簧有限公司”(子公司)。

(2)世界主要国家的专利网址。

阿根廷:http://www.mecon.ar/inpi/

爱尔兰:http://www.patentsoffice.ie/

爱沙尼亚:http://www.epa.ee/

澳大利亚:http://www.ipaustralia.gov.au/

奥地利专利局:http://www.patent.bmwa.gy.at/

巴西工业产权局:http://www.inpi.gov.br/

比利时专利局:http://european-patent-office.org/Patlib/country/belgium/

秘鲁:http://www.indecopi.gob.pe/

冰岛:http://www.patent.is/

波兰专利局:http://www.uprp.pl/

丹麦专利局:http://www.dkpto.dk/

德国专利商标局:http://www.deutsches-patentamt.de/

俄罗斯专利局:http://www.rupto.ru/

法国国家工业产权局:http://www.inPi.fr/

菲律宾:http://www.ipophilippines.gov.ph/

芬兰:http://www.prh.fi/

格鲁吉亚:http://www.global-erty.net/saqpatenti/

韩国知识产权局:http://www.kipo.go.kr/kpo2/ek/index.jsp/

荷兰工业产权局:http://www.bie.minez.nl/

加拿大知识产权局:httP://www.opic.gc.ca/

捷克:http://www.upv.cz/

克罗地亚:http://pubwww.srce.hr/patent/

立陶宛:http://www.is.It/vpb/engl/

卢森堡:http://www.eco.public.lu/

罗马尼亚:http://www.osim.ro/

马来西亚:http://www·kpdnhq·gov·my/ip/

马其顿:http://www.ippo.gov.mk/

美国:http://www.uspto.gov/

蒙古:http://www.mongol.net/ipom/

摩尔多瓦:http://www.agepi.md/

墨西哥:http://www.impi.gob.mx/

挪威:http://www.patentstyret.no/

葡萄牙:http://www.inpi.pt/

斯洛伐克:http://www.indprop.gov.sk/

日本:http://www.ipdl.ncipi.go.jp/homepg_e.ipdl/

瑞典:http://www.prv.Se/

瑞士:http://www.ige.ch/

斯洛文尼亚:http://www.sipo.mzt.si/

泰国:http://www.ipthailand.org/

土耳其:http://www.turkpatent.gov.tr/

西班牙:http://www.oepm.es/

希腊:http://www.obi.gr/

新加坡:http://www.ipos.gov.sg/

新西兰:http://www.iponz.govt.nz/search/cad/dbssiten.main

匈牙利:http://www.hpo.hu/

英国:http://www.patent.gov.uk/patent/dbase/index.htm/

意大利:http://www.european-patent-office.org/it/

智利:http://www.proind.gov.cl/

欧洲专利局:http://www.european--patent一office.org/

拉丁美洲:http://www.oepm.es/bases-documentales/latipat_sp?ACTION=RETOUR/

世界知识产权组织:http://www.wipo.int/

非洲地区工业产权组织:http://www.aripo.wipo.net/

非洲知识产权组织:http://www.oapi.cm/

欧亚专利组织:httP://www.eapo.org/

中国:http://www.sipo.gov.cn/

(3)专利检索常见问题及指引性解答。

①中国专利到哪里查?

以下网站均可以查中国专利。

国家知识产权局:http://www.sipo.gov.cn/sipo/zljs/

国家科技图书文献中心:http://www.nstl.gov.cn/

中国知识产权网:http://www.cnipr.com/

推荐使用国家知识产权局网,全部免费,包括全文。

②外国专利到哪里查?

欧洲专利局:http://ep.espacenet.com/

美国专利局:http://www.uspto.gov/patft/index.html

日本专利局:http://www.ipdl.ncipi.go.ip/homepg_e.ipdl

主要使用欧洲专利局网,但1920年以前的美国专利只能去美国专利局网查,授权的日本专利只能去日本专利局网查;以上三个网站查不到,可以去世界知识产权组织网站、各国专利局网站(教你免费查专利第10章)或Delphion网站(教你免费查专利第7章)查找。

③如何查找某一主题的中国专利?

在国家知识产权局网(http://www.sipo.gov.cn/sipo/zljs/),在“摘要,或“名称”后面的框内输入欲检索的主题词(关键词),如“计算机”、“涂料”等,或者在“分类号”或“主分类号”后面的框内输入欲检索主题所对应的国际专利分类号。

④如何查找某一主题的外国专利?

在欧洲专利局网(http://ep.espacenet.com/advancedsearch?locale=en_EP),在“Keyword(S)in title”、“Keyword(s)in title or abstract”后面的框内输入欲检索的英文主题词(关键词),如“computer”、“coat”等,或者在“International Patent Classification(IPC)”后面的框内输入欲检索主题所对应的国际专利分类号。

⑤如何查找某一个人申请的专利?

中文人名:在国家知识产权局网(httP://www.sipo.gov.cn/sipo/zljs/),在“发明(设计)人”或“申请(专利权)人”后面的框内输入中文人名。

英文人名:在欧洲专利局网(http://ep.espacenet.com/advancedsearch?locale= en_EP),在“Inventor(s)”后面的框内输入英文人名。

对于不准确的人名,可以使用截词符。

⑥如何查找某一个公司申请的专利?

中文公司名:在国家知识产权局网(http://www.sipo.gov.cn/sipo/zljs/),在“申请(专利权)人”后面的框内输入中文公司名。

英文公司名:在欧洲专利局网(http://ep.espacenet.com/advancedsearch?locale=en_EP),在“Applicant(s)”后面的框内输入英文公司名。

对于不准确的公司名,可以使用截词符。

⑦如何查找某一个专利号的详细信息,包括说明书全文?

一项专利从申请到授权过程中会产生一系列相关的号码,因此在采用Number Search检索专利时,一个非常重要的问题是首先要判断已知的号码属于哪种专利号,然后才能选择所对应的字段进行字段检索,在所对应字段后的检索框内输入号码。

⑧如何查找某一个专利在全世界受保护的情况?

用专利号查找其同族专利,然后判断每个同族专利的法律状态(第11章)。

⑨如何判断某一个中国专利是否有效?

从专利申请号判断(1988年以前的肯定过期了,如88100085)、从专利文献号判断(专利文献种类代码是A的为公开文本,目前该专利应该是处于申请阶段,如CN1687144A)。

⑩如何判断某一个国外专利是否在中国有效?

查找它的同族专利中是否有中国专利,但要注意核对当前日期与该国外专利申请日之间的时间差。

img29行内图 如何查找失效专利?

输入欲查找的主题词→对所得到的结果进行技术可行性挑选→判断专利的有效性。

img30行内图 仅仅知道一个中国专利的授权公告号,怎么查详细信息?

在中国知识产权网:http://www.cnipr.com,利用“发明授权”数据库查找。

img31行内图 为什么我检索不到我要的专利?

从以下几方面查找原因。

a.有没有输入错误?有时候是别人告诉你的信息就错了,比如发明名称,这时可以不输入全部的发明名称,只输入名称中个别词。

b.号码的输入格式不对:有时候不能输字母(如国别代码CN、法律状态代码A),有时候又必须输;有的网站字母与数字之间要加空格,有的网站不需要加;可以利用截词解决这个问题;有的网站逻辑与可以用“*”,有的网站只能用“and”。

c.所查找的专利太新了,还没有公开(中国专利是申请后18个月公开)。

img32行内图 JP 2003321605能否找到英文或中文的全文?

查找该日本专利的同族专利中有没有中国专利或英语国家的专利;经查找没有,只能在日本专利网站获取计算机翻译的英文说明书。

img33行内图 如何查找一段时间内中国内地申请的某类专利?

利用中国知识产权网进行查找。

img34行内图 非专利文献哪里查?

推荐国家科技图书文献中心网站http://www.nstl.gov.cn/,包括中外期刊、会议、学位论文、标准等各种类型文献。

(4)失效专利的检索。

失效专利从法律角度解释是超过了法律的保护期限,失去国家法律保护;但从技术角度上分析,仍具有很高的含金量和应用价值,任何企业和个人都可以根椐需要无偿使用。根椐测算,失效专利总量已达到我国知识产局受理专利申请的30%,并且每年还以10%左右的速度递增。

专利的失效有着诸多的因素:①未在中国授权的国外专利。《巴黎公约》成员国的国民就发明创造向某个缔约国首次提出申请专利后,可在一定期限内,向所有其他缔约国申请专利保护。如果国外专利一年内未在某缔约国申请,就不受该国专利法的保护。也就是说,国外专利如果在一年内没在中国申请保护,就不受中国专利法保护,只要产品不出口到该专利所辖地域就不算侵权。②超过专利保护期限的专利。按照我国《专利法》规定,发明专利受法律保护时间最多为20年,超过法律保护年限的专利便成为失效专利。③专利权人自动放弃专利权。由于某种原因,专利权人中断了交纳所属专利技术的保护年费,使其专利成为失效专利。如某些国外专利技术并未过期,但在当地已经失去了使用价值,自动声明放弃,使之成为失效专利。

失效专利检索方法如下:

①国内专利的信息检索:

通过专利文献出版社定期出版的《专利公报》、《中国失效专利》、《最新失效专利技术精选》等文献能够获得有关失效专利的信息。此外,我们还可以进入http://www.sipo.gov.c(国家知识产权局网站)、http://www.cnipr.com(中国知识产权网),进行中国法律状态检索,可以从专利申请号、法律状态公告日进行检索,点击检索结果中的法律状态便可以查出该项专利法律状态的详细信息。法律状态信息主要有公开、实质审查、请求生效、审定、授权,以及专利权的主动放弃、专利权的自动放弃、专利权的被视为放弃、专利权的终止、专利权的无效、专利权的撤销等。举例:输入申请专利号88105881.5显示的法律状态是:专利权终止(因未缴年费使专利权终止),表明此专利已成为失效专利。

②国外失效专利的信息检索:

a.欧洲专利法律状态检索:

进入http://www.epoline.org/portal/public点击register Plus就进入了https:/register.epoline.org/espacenet/regviewer页面,输入PublicationNnumber,就可以得到所有欧洲专利申请或欧洲申请的著录项目数据、同族专利数据以及法律状态、审查过程文件等数据。进入http://ep.espacenet.com,检索到某一具体专利著录的页面时,点击“NPADOC legal status”,就得到了该专利的法律状态,从中知道该专利是否是失效专利。

b.美国专利法律状态检索:

进入http://portal.uspto.gov/external/portal/pair点击Patent Application Information Retrieval进入专利申请状态数据库,可以对专利技术的法律状态进行检索,从而筛选出失效专利。

c.日本专利法律状态检索:

进入http://www.ipdl.inpit.go.jp//hamepg.ipd点击“经过情报检索”链接,可以进入日本专利法律状态检索。

同样,如果检索其他国家的失效专利,可以分别利用网上的各国专利数据库进入专利的法律状态页面获得相关法律信息,从而判断是否是失效专利。

12.Google学术搜索

为获取学术性资源,近年来网上涌现多个搜索学术资源的学术搜索引擎,其中专攻文献的Google要算较好的一个。使用Google学术搜索能够获得来自研究领域的论文、学位论文、摘要和技术报告等。Google学术搜索的主要功能有:从一个位置方便地搜索各种学术资源;查找研究报告、摘要及引用情况;通过您的图书馆查找到完整的论文;有的可直接链接全文。

Google学术搜索作为一个面向多学科的学术资源搜索工具,继承了Google简单实用的风格和搜索技术,将互联网搜索工具专门用于学术研究领域,以高质量电子期刊为学术资源主体,选取拥有科技资源的网站为合作伙伴,集期刊论文、会议文献、科技报告、专利文献、预印本文库等资源于一体,在保证文献的学术性和专业性基础上,将分散在数个系统内的各种网络信息资源整合在一个统一的平台上供大家共享,不仅扩大了用户查询学术信息的来源,更重要的是省去用户逐个进入各类数据库所耗费的大量时间。Google学术搜索实现了对学术信息进行有效筛选和过滤,有效剔除了冗余信息,摒弃垃圾信息,为学术检索需求提供可靠性强的学术信息,保证用户能及时、正确地吸收和运用有价值的信息,可以追踪学者的科研活动,可以利用引文分析,拓展我们的思路,还可以了解期刊的应用与排名。

Google学术搜索的推出为读者从大量信息中快捷、准确地查找出有价值的学术信息提供了方便。一方面Google学术搜索通过自有的引文链接能让检索者方便的掌握引文情况;另一方面Google学术搜索用特定的技术搜索,自动提取相符合的文献并进行有效的排序、推荐。

(1)Google学术搜索的检索方式。

Google学术搜索提供基本检索和高级检索两种检索方式。基本检索的界面只有一个检索框,往往对检索提问的构造要求较低,比较直观,检索过程相对简单。高级检索则有多个检索框,往往需要用户按照搜索引擎的检索规则和检索语法自行构造完整的检索提问式,检索的过程相对复杂,因此检索效率和检索结果的精度都比较高。

①通过关键词等检索获得命中文献以及被引情况:

在基本检索框内直接输入检索词,可以获得与检索词相关的文献,并按文献被引频次排序。所查文献有的链接到维普数据库,有的链接到万方数据库,有的链接到知网空间等,有的文献直接点击就可下载全文。

要搜索某一作者的文章时,可以在基本检索框内输入作者姓名,就会获得大量与该作者相关的信息,包括作者自己发表的文章以及引用过的文章的一些文献也会出现在其中。因此,在用作者姓名作为检索词时,最好是使用“author:作者”的形式,可以排除一些引用该作者文章的文献。为了精确获取某篇文章,可以直接在检索框内输入文章篇名,但是不排除有文章标题相同的情况,使用“作者篇名”(词间空一格,相当于逻辑与)的格式,则所需要的某篇文章会排在检索结果的前面。通过关键词或著者姓名检索获得命中文献的同时,文献被引用的情况也显示出来了。检索结果按“引用次数”的多寡先后次序排列,引用次数越多排列越靠前。

通常实际检索时多使用词语作为关键词。对于期刊文献来说,每个关键词可以是字、单词、词组,也可以是短语。复杂课题的检索,分析主题后要进行不同关键词的选词。如何选择关键词将决定检索结果的不同排列,而检索过程多因选词不当,无法发挥检索功能,影响检索效率。用单个关键词检索复杂课题时,需要详细分析课题、分析需求,找出实质性的概念,选择正确的关键词才能提高查准率,有时还需要选择多个关键词建立检索式。分析课题时需要分清主要概念,确定需要排除的某些概念和不宜选用的泛指概念,以便在制订检索策略时有所侧重。要保证检索提问的确切表达式就要正确选择关键词。各种类型的检索课题对查全率和查准率都有着不同的要求。可使用上位概念的方法来扩大检索范围,提高查全率。去掉部分限制条件,也可扩大检索范围来获得较高的查全率。倘若查准率要求较高,则应使用专指性概念较强的检索词或增加限制概念来缩小检索范围,可通过对字段进行限定的方式来提高查准率,也可通过时间段的选择来缩小检索范围,从而提高查准率。一般说来因用户多不把所有需要查询的相关网页都浏览一遍,故查准率在很大程度上决定了搜索的质量。

②学术高级搜索:

Google学术搜索还为用户提供了高级检索功能,点击检索框右面的“高级检索”即可进入高级检索界面,进入更为精确的查询。Google学术搜索的高级检索提供了包括关键词、作者、出版物名称、出版日期以及结果显示等多种选项。关键词提供限于文献题名或者文中其他任何位置的搜索,并且有4种题名匹配方式“包含全部字词”、“包含确切的词语”、“包含至少一个字词”、“不包含字词”。采用作者姓名搜索是简单有效的搜索途径,只要在检索框内输入作者姓名,便可以检索到与该作者有关的文献。而在出版物后面的检索框中输入所要检索刊物的名称,与所查文献的篇名结合起来使用,可以更为精确地查找到需要的文献。按照出版物日期范围搜索,可将文献的出版时间限定在一定范围之内,只需直接输入起止年。限定结果显示方式,可以在结果搜索页面限制每页所显示的结果数,结果显示有10、20、30、50、100条5种可供选择。其中,结果显示为必选项,通常默认为每页10条的结果,而其他几个选项,用户可以根据自己实际需要灵活运用,以缩小检索范围,进行更为精确的检索。

(2)检索结果的格式和原文的获取。

Google学术搜索与Google网页搜索一样,把最合适的结果排到前面,对搜索结果按相关性进行排序。最相关的信息显示在页面上方,这一排序同时考虑到每篇文章的全文内容、作者发表该文章的刊物以及该文章被其他学术论著引用的次数等要素。用户在大多数情况下都需要获得部分文献的全文,但各文献数据库的收录范围都是有限的,往往要在几个数据库中进行查找比较,增加了检索的工作量。Google学术搜索在某种程度上较好地解决了这些问题,可以说是各种传统专业文献数据库的集成,它能实现多字段的跨库检索。

一般情况下,数据库检索系统都会对用户有一定的限制,要求用户先登录然后才能使用,用户才能选择自己需要的数据库和获取全文。然而,应用Google学术搜索有的条目直接点击就可下载原文,给检索者直接获取原文带来极大的方便。

(3)Google Scholar。

Google Scholar(GS)是Google公司于2004年底推出的专门面向学术资源的免费搜索工具(http://scholar.google.com),能够帮助用户查找包括期刊论文、学位论文、书籍、预印本、文摘和技术报告在内的学术文献,内容涵盖自然科学、人文科学、社会科学等多种学科。Google Scholar不仅仅从Google收集的上百亿个网络页面中筛选出具有学术价值的内容,而且最主要的方式是通过与传统资源出版商进行的合作来获取足够的有学术价值的文献资源。目前,Google公司与许多科学和学术出版商进行了合作。他们已经与学术、科技和技术出版商,如ACM、Nature、IEEE、OCLC进行了广泛的合作。这种合作使用户能够检索特定的学术文献,通过Google Scholar从学术出版者、专业团体、预印本库、大学范围内以及从网络上获取学术文献,包括来自所有研究领域的同级评审论文、学位论文、图书、预印本、摘要和技术报告。

三、信息检索服务的发展方向

信息检索服务是图书馆的基础工作。随着信息资源范围的扩大和加工处理水平的提高,检索服务向着方便读者利用和深层次服务的方向发展,读者并不需要很深的检索知识,他们只需在一个界面友好的网站上,按照检索系统所做的各种提示完成检索过程。而系统根据读者的检索习惯和思维方式设计多种检索途径和方法,通过链接将相关的信息和知识联系在一起,形成一个依托网站的知识结构,提高检索的效率和深度。

信息检索服务发展方向有:统一检索平台,采用信息检索分级制度,检索界面的集成与简化。

信息数据和存储方式各异,信息资源处于无序状态。统一检索平台将图书馆各种类型的信息资源及数据库中的各种异构数字资源进行整合,为读者提供一种更好的检索服务,从而提高资源的利用率。如中国高等学校信息保障系统(CALIS)统一检索系统采用了新型的基于元数据库的检索技术,能够对分布在本地和异地的各种异构资源提供统一的检索界面和检索语言。系统可检索的资源类型包括原文、图片、引文、文摘、馆藏、相关文献等。CALIS统一检索系统提供多种检索方式,包括简单检索、高级检索、二次检索等,并支持多种检索运祘等。利用CALIS统一检索系统,管理员能对各种信息资源的访问进行限制、监控、统计、计费等处理。CALIS统一检索系统为读者提供“我的学科”、“我的资源”、“我的收藏夹”、“我的搜索历史”等个性化检索服务。CALIS统一检索系统还实现了与CALIS其他各种应用系统(如资源调度、统一用户管理、馆际互借等)的无缝集成,可以使读者更方便地访问国内外文献资源。

采用信息检索分级制度,检索界面分为专业人员检索与新手检索。专家检索界面是供有经验的图书馆员及对检索熟悉的人员使用,目的是达到较高的检索效率,而新手界面主要是为那些对检索不熟悉的读者准备的,列出详细步骤,目的是提高用户的检索能力。

对检索界面的集成与简化,以及对各种数据库检索结果去重,是图书馆提高检索信息服务中的一个重要内容。

数字时代信息检索服务坚持以读者为中心的信息交流、知识摘取和知识应用,读者可以根据自己的需求选择,也可以根据自己的检索习惯与方法选择检索界面及检索式,设置检索限制、标识、扩展结果以及对主题词和作者的再检索等。读者在一个界面良好、人机交互的环境中完成查找信息的过程。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈