首页 理论教育 网络智能搜索机理

网络智能搜索机理

时间:2022-03-04 理论教育 版权反馈
【摘要】:智能搜索引擎试图从语义上去理解和索引Web文档,并能根据用户的相关信息智能化地理解用户的信息需求,在系统实现上提供概念检索,而不是简单的字符串匹配。当用户提出查询请求时,智能搜索引擎通过概念匹配,利用网络挖掘技术对Internet进行深层信息挖掘,能为用户提供个性化、专业化的信息检索服务。

10.3 网络智能搜索机理[3,4]

智能索引擎试图从语义上去理解和索引Web文档,并能根据用户的相关信息智能化地理解用户的信息需求,在系统实现上提供概念检索,而不是简单的字符串匹配。

在信息收集归类方面,除Web文档内容的关键词外,智能搜索引擎还利用尽可能多的信息来标引文档,提供给用户尽可能多的检索方式,更重要的是系统能在语义层次上对Web文档内容进行理解并索引归类。

在处理用户需求方面,智能搜索引擎能自动记录用户的各种需求,以建立用户档案库,并能收集、分析用户的反馈信息,根据用户的反馈来调整、更新用户档案库,以达到准确描述用户需求的目的。

在处理查询方面,智能搜索引擎能使用自然语言处理、机器学习和信息推送等技术,为用户提供更加准确、可靠和方便的信息搜索服务。

智能搜索引擎进行搜索时要构设知识库和用户档案库。知识库是对信息综合、提取、概括与分析后产生的知识集合,它提供智能搜索引擎理解、处理用户提问的资源标识。用户档案库则用来存储用户注册的基本资料、用户访问记录、用户兴趣偏好、用户访问行为等用户信息。智能搜索引擎内部共设有语义理解、指令组织、访问登记、兴趣识别、信息过滤、信息加工、页面定制七大功能模块。在具体的搜索过程中,语义理解模块依据知识库提供的资源标识,对用户提问进行分析、推理,然后由指令组织模块发出HTTP请求的搜索指令,同时由访问登记模块对用户提问、定题需求等进行用户角色与信息行为登记,将用户的访问记录、兴趣爱好等信息传递给用户档案库保存起来。一旦产生新的信息资源,智能搜索引擎便由兴趣识别模块激活,抽取用户的信息需求,进而由指令组织模块形成推荐推送服务的检索指令。在从网络信息库中搜索到相应的信息数据后,返回给智能搜索引擎的信息过滤和信息加工模块进行过滤、排序、组织、加工,然后经页面定制模块定制信息页面,将检索结果或推送信息提供给用户使用。

智能搜索引擎以用户需求为先导来进行信息搜集和信息加工,根据用户特定的需求以及在一段时期内的偏好为衡量标准来筛选信息;用户界面提供友好的自然语言查询,当用户的查询请求不明确时,系统会利用知识库中的推理机制推断用户的潜在需求,选择与用户习惯最相近的需求进行检索;检索完成后允许用户对结果进行满意度和相关度评价,这些评价被传回给知识库,一方面修正用户的兴趣加以学习,另一方面完善信息加工和信息相关度匹配的规则,为下一次检索提供更可靠的保证。当用户提出查询请求时,智能搜索引擎通过概念匹配,利用网络挖掘技术对Internet进行深层信息挖掘,能为用户提供个性化、专业化的信息检索服务。

1.从字面匹配到概念匹配

传统搜索引擎的检索过程大多是对索引数据库中字面信息的匹配,由于目前网络信息的多样性和不规范性,单纯的字面匹配方式会导致错误匹配和虚假匹配,检索出大量冗余信息、误导和欺骗用户的信息;同时由于用户理解差异的存在,会导致使用某些关键词检索时得不到任何信息。智能搜索引擎引入概念匹配的检索方式,对关键词进行有效控制,可以实现智能检索。

概念匹配,也可称为语义检索、语义交互,是一种建立在信息的概念相关关系基础上的检索,它通过建立某种语义索引,对用户进行交互式的导航,从而实现信息的深度检索。基于概念检索的智能搜索引擎必须建立语义网络的相关知识库,在标引阶段,自动抽取文档中能表达内容的概念,据知识库标引为相应的概念或分类号;在检索阶段,对用户输入的检索词或提问式进行分析,取出其语义,有效识别用户的检索请求和相应概念,帮助用户选用合适的词语表达信息需求,再与标引库进行概念匹配,匹配在语义上相同、相近或包含的词语,从而检索出用户所需信息。

2.从提供表层信息到挖掘深层信息

Internet是一个巨大的、没有统一描述模型的异构数据库,数据类型复杂,表现形式多样,每时每刻更新,网络站点间存在复杂的相互联系,网络信息具有开放性、异构性、分布性、动态性、关联性等特点。而目前多数搜索引擎沿用传统的关系数据库处理信息的思想,适于处理静态的、结构化的信息,其检索功能只能向用户提供表层信息,只是为了帮助用户从大量的数字化资源中找到满足用户需要的信息。而越来越多的网络用户需要深入内容的信息处理技术,摆脱表层信息的干扰,对网络数据作更深层次的分析与挖掘,使信息按内容特性聚类,体现一定的知识性,并希望处理过程灵活、开放。智能搜索引擎使用网络挖掘技术即能满足用户的这一需求。

3.从满足表层需求到预测用户需求

传统搜索引擎只能满足用户提出的表层信息需求,而智能搜索引擎还能分析用户潜在的信息需求,预测其需求。智能搜索引擎通过与用户交互,获取用户信息,包括用户检索的学科领域、所需信息类型、信息用途、用户背景、用户领域知识等,以准确理解关键词的含义和用户的检索目标。例如,用户输入多义检索词后,根据用户模型中的专业知识信息或检索式中其他检索词类别,帮助用户推断关键词所在领域,将领域信息告诉用户,并允许用户选择或修改领域信息。

此外,智能搜索引擎的学习能力能让其在工作中自主地发现自身的不足,然后通过学习不断地扩展知识库,以适应不断变化的工作环境。同时,它可以记录下众多的用户数据来训练自己,跟踪并充分分析用户提过的问题,识别和预测用户的兴趣或偏好,在实践中自主更新知识。如果用户指示某次检索结果是成功的,则对每一个超链接代表用户兴趣的关键词加以注释,并存入知识库来实现“自我知识”的增长。

4.从大众化服务到个性化、专业化服务

传统的搜索引擎由于基于字面的简单匹配,对于所有用户的相同关键字的检索,会返回相同的结果,忽略用户的真正需求及其专业性质,这种非个性化、非专业化的检索方式不能快速选定用户感兴趣的主题,缺少适应信息源变化的能力。而智能搜索引擎则可以为用户提供个性化、专业化的服务,方便用户的检索。

智能搜索引擎能实现信息的智能推拉,使用户可以选择服务方式和资源,使检索结果更贴近用户需求,从而提高主动服务的能力,实现完善的个性化服务。例如,当搜索引擎发现与用户需求相关的信息时,通过电子邮件、电话、传真等方式,自动传送给用户所关心的信息、最新的信息,供用户选择使用。

另外,用户能根据自己的需要,设置个性化选项。例如:在搜索信息时,用户希望优先考虑的信息源、信息类型、地域、语种、相关链接、网站的更多页面、网页大小、描述语、URL、连续访问同一服务器的最小间隔时间等;在检索结果处理方面,个性化选项可以按用户要求进行信息过滤、选择排序方式和检索结果,如可选择匹配结果、相关链接、推荐链接,或直接返回权威结果等。这样可以使搜索引擎观察不同用户的行为,了解用户的搜索风格,从而调整自身以适应用户的爱好和需求,满足用户的个人需要。

专题性的智能搜索引擎能查询特定学科和主题信息,它集中和优化某特定领域的全面而专深的信息,可以相对容易地实现文档的分析、处理和面向领域的知识库的建立,在该领域内向用户提供全面的、高质量的专业化信息,有效地提高检索结果的准确性、相关性,在满足用户的专业需求的同时,满足用户的个性化需求。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈