首页 百科知识 智能搜索引擎

智能搜索引擎

时间:2022-10-17 百科知识 版权反馈
【摘要】:由此提出了智能搜索的概念。智能搜索引擎可以根据互联网本身的链接结构对相关网站自动进行分类,再加上结构严谨、萃取精华的开放式信息目录,为每一个查询迅速提供准确的结果。智能搜索引擎可以预期用户的需求,并可有效地抑制关键词的多义性。智能搜索引擎还可以采用协同式检索方法。

9.2.4 智能索引

据专家评测,目前主要的搜索引擎返回的相关结果的比率不足45%,其原因是现有的Internet搜索引擎拥有极少量的知识,并且是面向最一般的用户模型。不划分知识领域,不对用户建立任何描述以及使用关键词匹配的交互方式,都限制了搜索引擎的使用效率。由此提出了智能搜索的概念。

智能搜索引擎应具有的特点:新一代中文智能搜索引擎是基于汉语语法、词的上下文和语义等中文信息处理技术,自动收集、识别Internet上的WWW和News信息,智能化的提取摘要和关键词,建立索引,提供查询和对不良信息的监控、报警功能,并有网络信息自动发现和查询系统。它采用加权的启发式搜索算法控制信息资源的搜集,系统根据用户配置的领域导向词和资源服务器所在地域信息,以启发式函数计算每个URL的权值,并选择权值高的URL优先访问。

智能搜索引擎可以根据互联网本身的链接结构对相关网站自动进行分类,再加上结构严谨、萃取精华的开放式信息目录,为每一个查询迅速提供准确的结果。

智能搜索引擎可以预期用户的需求,并可有效地抑制关键词的多义性。智能搜索引擎还可以采用协同式检索方法。该方法一般用于一个特定的用户(如一个或一组新闻工作者、一个新闻媒体、一个或一组受众)。协同式方法有时又称为公众学习方法,它将其他用户的反映反馈给当前的用户。系统不去计算分类项目的相似程度,而是计算用户之间的相似程度。协同式方法不分析分类项目的内容。协同式方法一般用于非文本化的数据,如电影、音乐等,但是也有的系统将其用于文本数据的挖掘,如新闻过滤等。也有一些系统用与电子邮件处理、会议时序安排、电子新闻过滤和娱乐节目推荐。

与智能搜索引擎技术相关的还有信息智能“推送”技术和个性化检索技术。

基于网民和新闻工作者访问互联网的特点,在用户提取信息的搜索过程中,根据其输入的关键词,通过机器学习,可以识别和预测其兴趣或偏好,从而有针对性、及时地向网民和新闻工作者主动推送相关知识和最新信息、新闻或新闻线索。推送的形式可采用频道式推送、邮件式推送、网页式推送或专用式推送。目前已有构造Web访问模式树(WAP tree)的算法,可从大量信息访问日志中挖掘访问信息的模式,也可以从用户访问文档的超链接来预测用户的访问偏好,其知识发现采用关联性法则。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈