首页 理论教育 与集成搜索

与集成搜索

时间:2022-03-10 理论教育 版权反馈
【摘要】:集成搜索引擎可以看做是元搜索引擎的初级形态。集成搜索引擎以其方便、实用在网络搜索工具家族中占据一席之地。在接受用户查询的关键字时,同时在其他多个引擎上进行搜索,但与集成搜索引擎不同的是元搜索引擎先将各搜索引擎返回结果优化后再提供给用户。元搜索引擎的特点在于检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术支持。

7.2.3 元索引擎(metasearchengine)与集成搜索

任何搜索引擎的设计,均有其特定的数据库索引范围、独特的功能以及预期的用户群指向。一种搜索引擎不可能满足所有人或一个人所有的检索需求。在需要使用多种搜索引擎,对搜索结果进行比较、筛选和相互印证时,为解决逐一在各搜索引擎中分别多次输入同一检索请求的烦琐操作,集成搜索引擎和元搜索引擎应运而生。

1.集成搜索

集成搜索(All‐in‐One Search Page)也称为“多引擎同步检索系统”,是在一个页面中链接若干种独立的搜索引擎,检索时需点选或指定搜索引擎。一次检索输入,多引擎可以同时搜索也可以选择特定引擎搜索,搜索结果由各搜索引擎分别以不同页面提交。集成搜索的实质是利用网站链接技术形成的搜索引擎集合,而并非真正意义上的搜索引擎。常用的集成搜索有觅搜(http://www.metasoo.com),如图7‐8所示。觅搜虽然自称为元搜索引擎,但觅搜的结果和Google没有区别,而输入关键字后,点击可到各主要搜索引擎,因此实际上是集成搜索。集成搜索引擎可以看做是元搜索引擎的初级形态。集成搜索引擎以其方便、实用在网络搜索工具家族中占据一席之地。

img209

图7‐8 觅搜集成搜索引擎

2.元搜索

元搜索引擎与集成搜索引擎一样,本身没有“蜘蛛人”等搜索机器,也没有独立的索引数据库,而是利用其他搜索引擎进行工作。在接受用户查询的关键字时,同时在其他多个引擎上进行搜索,但与集成搜索引擎不同的是元搜索引擎先将各搜索引擎返回结果优化后再提供给用户。

元搜索引擎的特点在于检索请求提交、检索接口代理和检索结果显示等方面,均有自己研发的特色元搜索技术支持。如提交检索请求时,根据源搜索引擎的特点和技术参数,指定优先顺序,并对检索时间、检索结果数量进行控制;而对检索结果的显示,不同的元搜索引擎有不同的处理技术,由于元搜索引擎设定的检索结果排序依据、最大返回结果数量、相关度参数及优化机制等不同,同样的关键字在不同元搜索引擎里显示检索结果的数量多少、排序先后、结果信息描述选择亦有较大差异。

3.元搜索引擎基本功能和特点

理想的元搜索引擎应该具备以下特点和功能:第一,涵盖较多的搜索资源,可随意选择和调用源搜索引擎。第二,具备尽可能多的可选择功能,如资源类型(网站、网页、新闻、软件、FTP、MP3、图像等)选择、返回结果数量控制、结果时段选择、过滤功能选择等。第三,支持不同搜索引擎间检索语法规则、字符的转换功能(如将OR运算符转换成“|”运算符)。第四,详尽全面的检索结果信息描述(如网页名称、URL、文摘、源搜索引擎、结果与用户检索需求的相关度等)。

不同的元搜索引擎的优化方式也不太一样。比如,有的元搜索引擎会根据被多个搜索引擎同时搜索到的数量来排序搜索结果。相对来说,国外的元搜索较多,且比较稳定,主要的有InfoSpace、Dogpile、Vivisimo等。而国内的元搜索引擎起步晚,数量少,且不太稳定。许多元搜索引擎生存一年就消失了,这也影响了元搜索引擎的推广。现有的中文元搜索引擎有:

搜乐网(http://www.sooule.com)

Ixquick(http://www.ixquick.com)

万维网站(http://www.widewaysearch.com:8000)

以上元搜索引擎中,相对而言,搜乐对从Google、百度和必应的搜索结果做了一些优化选择。而Ixquick主要来自于百度的结果,而万维网站的搜索结果往往不知所云。因此在中文元搜索引擎中,目前具有较好实用价值的是搜乐网,如图7‐9所示。

img210

图7‐9 搜乐元搜索引擎

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈