首页 百科知识 利用网络链接结构特征构建叙词表

利用网络链接结构特征构建叙词表

时间:2022-02-27 百科知识 版权反馈
【摘要】:3.1.4 利用网络链接结构特征构建叙词表[5]该方法通过网络链接统计来自动构建一部用于网络环境的领域叙词表。网页之间的链接结构实际上体现了网页内容之间的语义网络关系。通过分析网络链接结构构建叙词表实质上利用了网络计量学原理,与此相类似的方法还有一种基于引文计量的词表构建方法。如Schneider在其博士论文中采用了一种基于引文计量的方法并辅助人工智力实现半自动化构建叙词表。
利用网络链接结构特征构建叙词表_自然语言叙词表自动构建研究

3.1.4 利用网络链接结构特征构建叙词表[5]

该方法通过网络链接统计来自动构建一部用于网络环境的领域叙词表。其理论前提是:相互链接的网页其内容更有可能讨论一个主题;链接方网页能够有效描述被链接方网页。网页之间的链接结构实际上体现了网页内容之间的语义网络关系。该方法有三个构建步骤:首先选择学科领域内一组具有代表性的高质量网站;其次通过网络超链分析技术构建网站内容结构,包括剔除噪声链接、挖掘网页间的语义关系包括等级关系和平行关系、把各网页归纳到不同概念类;最后通过统计内容结构中的语词的互信息值计算语词之间的相关性,从而得到一个专业领域的Web用词表。因为网络内容超链的结构比较复杂,用这种方法来确定词间关系比直接通过对领域相关文献的内容分析来确定词间关系更为复杂。

通过分析网络链接结构构建叙词表实质上利用了网络计量学原理,与此相类似的方法还有一种基于引文计量的词表构建方法。如Schneider在其博士论文中采用了一种基于引文计量的方法并辅助人工智力实现半自动化构建叙词表。他以牙周病学作为案例,采用对调查文献实施同引分析、引文上下文分析、共词分析等文献计量方法识别候选叙词之间关系,同时也监控特定领域中潜在的术语学变化和概念变化[6]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈