首页 百科知识 网络商务信息收集工具

网络商务信息收集工具

时间:2022-07-23 百科知识 版权反馈
【摘要】:1.搜索引擎的概念与特点搜索引擎是一类运行特殊程序的、专用于帮助用户查询Internet上的WWW服务信息的Web站点。搜索引擎提供的导航服务已经成为Internet上非常重要的网络服务,搜索引擎站点也被美誉为“网络门户”。全文搜索引擎图标如图42所示。这类搜索引擎的优点是返回结果的信息更大、更全,其缺点是用户不能够充分使用元搜索引擎的功能,需要作更多的筛选。

1.索引擎的概念与特点

搜索引擎(Search Engine)是一类运行特殊程序的、专用于帮助用户查询Internet上的WWW服务信息的Web站点。它以一定的策略在Internet中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到信息导航的目的。其作用主要体现在:

(1)搜索引擎使用自动索引软件来发现、收集并标引网页,建立数据库。

(2)搜索引擎以Web形式提供给用户一个检索界面,供用户输入关键词、词组或短语等检索项。

(3)搜索引擎代替用户在数据库中查找出与提问匹配的记录,并返回结果且按相关度顺序排列。

目前Internet上有多种文字的至少数以千计的搜索引擎,它们基本上都是由信息查询系统、信息管理系统和信息检索系统三个部分组成的。其特点是,由自动索引软件生成数据库,收录、加工信息的范围广、速度快,能及时地向用户提供新增信息。搜索引擎提供的导航服务已经成为Internet上非常重要的网络服务,搜索引擎站点也被美誉为“网络门户”。

2.搜索引擎的分类

搜索引擎可按信息搜集方法和服务提供方式的不同,分为以下三类。

1)目录索引搜索引擎

目录索引是以人工方式或半自动方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中,仅仅是按目录分类的网站链接列表而已。信息大多面向网站,提供目录浏览服务和直接检索服务,用户完全可以不用进行关键词(key⁃words)查询,仅靠分类目录找到需要的信息。这类搜索引擎由于加入了人工的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。目录索引搜索引擎中最具代表性的莫过于大名鼎鼎的Yahoo,其他著名的还有Open Directory(DMOZ)、Looksmart、About等。国内的搜狐、新浪网易也属于这一类。目录索引搜索引擎图标如图4⁃1所示。

图4⁃1 目录索引搜索引擎图标

2)全文搜索引擎

全文搜索引擎是名副其实的搜索引擎,它们都是从Internet上的各个网站提取信息(以网页文字为主),按一定的规则置入数据库中,用户使用查询条件检索数据库中相匹配的记录时,其会按一定的排列顺序将结果返回给用户。全文搜索引擎通常由一个称为“蜘蛛”(spider)的机器人程序以某种策略自动地在Internet中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户,其服务方式是面向网页的全文检索服务。这类搜索引擎的优点是信息量大、更新及时、不需人工干预,其缺点是返回信息过多,有很多无关信息,用户必须从结果中筛选。这类搜索引擎中国外具代表性的有Google、Fast/ALLTheWeb、AltaVista、Inktomi、Teoma、WiseNut,国内著名的有百度(Baidu)。全文搜索引擎图标如图4⁃2所示。

图4⁃2 全文搜索引擎图标

3)元搜索引擎

元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。这类搜索引擎没有自己的数据库,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。其服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息更大、更全,其缺点是用户不能够充分使用元搜索引擎的功能,需要作更多的筛选。这类搜索引擎的代表是InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。

3.用目录索引检索收集商务信息

目录分类检索是将已注册的网站按树形结构分类,组成供用户搜索的类目和子类目,用户只要点击相关的类目标题,就可以查找此类网站信息资源。

4.关键字检索

关键字检索是指搜索引擎向用户提供一个待查询的关键字、词组、句子的查询输入框界面,用户按一定规则输入关键字并提交后,搜索引擎就开始在其索引数据库中查找相关信息,然后将结果返回给用户。下面以在百度(www.baidu.com)上查询中国商品交易有关资料为例说明关键字检索的操作方法。

(1)进入百度首页,在查询文本框中输入“中国商品交易”,如图4⁃3所示。

(2)系统显示图4⁃4所示的中国商品交易网站列表,单击“中国商品交易中心”即可进入该网站查询有关资料。

选择关键字时要注意以下几个问题:

首先,检索目标要明确。要完成一个有效检索,应当确定要检索的是什么。在确定主题之后,应当列出一个与检索信息有关的单词清单,如果主题范围狭小,不妨简单地使用两三个关键词试一试。如果不能准确地确定检索的是什么或检索的主题范围很广,不妨使用Ya⁃hoo等搜索网站的分类检索,尽可能缩小检索范围。许多检索网点允许只在网站中检索,或只在新闻组中检索,或只在某个特定地理区域检索。

其次,使用布尔操作符、引号或括号、通配符来改善检索过程。布尔操作符提供了一种包括或排除关键字的方法,以及检索引擎如何翻译关键字的控制方法。大多数检索引擎提供了使用引擎的提示,以及在检索中输入布尔操作符的相应方法,但它们一般都支持基本的布尔操作:AND(与)、OR(或)和NOT(非)。检索时,通常不必输入大写的布尔操作符,但大写却能直观地分隔关键字和操作符。应该指出,各个检索工具所使用的符号和格式是不尽相同的。

图4⁃3 百度首页

图4⁃4 中国商品交易网站列表

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈