首页 百科知识 搜索引擎的类型

搜索引擎的类型

时间:2022-10-17 百科知识 版权反馈
【摘要】:全文搜索引擎的索引数据库中存储的信息有网站名、地址和网页的文本信息,其服务方式是面向网页的全文搜索服务。该类搜索引擎的优点是信息量大,更新及时,查询全面而且充分;缺点是返回信息量过多,有很多无关信息,用户必须从中进行筛选。

9.2.2 索引擎的类型

搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。

1.全文搜索引擎

全文搜索引擎又称机器人搜索引擎,是利用Spider程序以某种策略自动地在互联网搜集和发现信息,由索引器搜集的网络信息建立索引数据库,索引器根据用户的输入从索引数据库中查询匹配的相关纪录,然后按一定的排列顺序将结果返回给用户。简单而言,这是一种由程序自动抓取网上信息的自动搜索引擎。

全文搜索引擎的索引数据库中存储的信息有网站名、地址和网页的文本信息,其服务方式是面向网页的全文搜索服务。该类搜索引擎的优点是信息量大,更新及时,查询全面而且充分;缺点是返回信息量过多,有很多无关信息,用户必须从中进行筛选。

国外具有代表性的有:Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等;国内具有代表性的有:百度、天网、中国搜索等。如图9-1所示。

img88

图9-1 全文搜索引擎

2.目录式搜索引擎

目录式搜索引擎是一种目录型检索工具,又称为网络目录(Web Directory)、目录索引类搜索引擎、站点导航等,是以人工或半自动的方式搜集信息,由编辑人员查看信息以后,人工形成信息摘要,并将信息置于事先确定的分类框架中。

目录式搜索引擎的索引数据库中存储的是互联网上各网站的站名、网址和内容提要。用户页面基本上都是分级结构。首页提供了几个大类的入口,用户可以一级一级向下访问,直到找到符合要求的类别。这类搜索引擎往往还伴有网站查询的功能,又称之为网站检索,即提供一个文字输入框,用户输入要查找的字词或短语,搜索引擎便会查找出相关的站名、网址和内容提要,并把结果显示出来。其服务方式大多面向网站,提供目录浏览服务和直接检索服务。

目录式搜索引擎的优点是搜索的范围比全文搜索引擎小,查询效率高,不需要太多的专业知识;缺点是容易遗漏某些信息,查全率低。国外最具代表性的莫过于大名鼎鼎的Yahoo,还有Open Directory Project(DMOZ)、LookSmart、About等,国内为搜狐、新浪网易。如图9-2所示。

img89

图9-2 目录式搜索引擎

3.元搜索引擎

元搜索引擎是一种调用其他独立搜索引擎的引擎,它本身并没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行去重、重新排列等,作为自己的结果返回给用户。

元搜索引擎的服务方式是面向网页的全文搜索。优点是返回结果的信息量更大、更全,缺点是不能够充分发挥所使用搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的国外代表是InfoSpace、Dogpile、Vivisimo等,国内为搜星搜索。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。

4.几种非主流形式

(1)集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。

(2)门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。

(3)免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈