首页 理论教育 基于内容的交互式过滤与推荐

基于内容的交互式过滤与推荐

时间:2022-02-28 理论教育 版权反馈
【摘要】:基于内容的过滤系统的基本原理是把信息资源内容和用户兴趣模型进行相似性匹配,按照相关度排序把与用户兴趣模型相匹配的信息推荐给用户。主要采用基于关键词的匹配,用关键词匹配技术实现基于内容的过滤。这个系统的缺点是局限于根据用户所列出的关键词为用户推荐文章,却不能为用户推荐新的感兴趣的文章。

6.3.1 基于内容的交互式过滤与推荐

基于内容的过滤系统的基本原理是把信息资源内容和用户兴趣模型进行相似性匹配,按照相关度排序把与用户兴趣模型相匹配的信息推荐给用户。其关键技术是相似性计算,通常是根据用户模型(profile),从信息源中匹配与之相关的内容,把其中符合特定标准的部分筛选出来呈送给用户。主要采用基于关键词的匹配,用关键词匹配技术实现基于内容的过滤。具体过程如图6-4所示:

img58

图6-4 基于内容的过滤

用户把感兴趣的主题以关键词形式表示并呈送给过滤器,过滤器对文档中的信息内容进行扫描,返回带有这些关键词的文档。关键词匹配过滤存在一定的缺陷,比如,由于过滤的结果只取决于用户信息需求模型与信息源的匹配程度,那么关键词匹配过滤的结果与用户呈送的关键词密切相关,如果用户呈送的关键词不能准确表示其需求,则过滤的结果很难满足用户的需要。此外,关键词匹配过滤不能区分信息资源质量的好坏,也不能动态地为用户推荐其可能感兴趣的信息。

基于内容过滤的系统的优点是简单、有效,缺点是它在为某一个确定的用户查找信息时不考虑其他用户的反馈,即不能为用户发现新的感兴趣的资源,而只能发现和用户已有兴趣相似的资源。典型的如美国斯坦福大学Tak Yan研发的SIFT(The Stanford Information Filtering Tool)系统,它主要针对世界性新闻组网络信息进行过滤。该系统要求用户用明确清晰的关键词初始化兴趣模型,然后系统利用向量空间模型方法或更直接的布尔逻辑方法,过滤出与用户的兴趣模型相匹配的网络新闻文章推送给用户。这个系统的缺点是局限于根据用户所列出的关键词为用户推荐文章,却不能为用户推荐新的感兴趣的文章。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈