首页 百科知识 叙词表在网络环境中的发展趋势

叙词表在网络环境中的发展趋势

时间:2022-02-27 百科知识 版权反馈
【摘要】:表2-5 现有叙词表改造成本体的情况[13]总之,不论是叙词表在网络环境中的应用与发展,还是叙词表与新技术融合后的创新,都表现出传统情报检索语言的强大发展势头。这表明,以叙词表为代表的情报检索语言不仅不会消亡,反而会在新技术的推动下迅速发展。
叙词表在网络环境中的发展趋势_自然语言叙词表自动构建研究

2.1.2 叙词表在网络环境中的发展趋势

Taxonomy warehouse(分类仓库)按照美国标准“ANSIZ39.19-2005”收录了欧美各国在网络环境中使用的分类表、叙词表、规范文档、词典共计510部,涵盖73个学科,涉及39种语言。通过对分类仓库中收录的445部词表进行统计,可以看出近年来词表编制呈现下列发展趋势[6][7]

(1)词表编制数量有增无减。与1989年统计[8]相比,2006年政府机构编制的词表增加了8.9%,公司编制的词表更是由1989年的1.8%上升了17.5%;由于互联网的广泛应用,也涌现出一批为满足网站用户需要而由网站自编的词表,占5.6%。受控词表正在受到越来越多的政府、公司和网站的重视(见图2-1)。

img4

图2-1 叙词表编制机构分布

(2)词表向数字化和网络化发展。与1989年相比[8],印刷版所占的比例已由97.4%下降到了34.4%,缩微版也由12.8%降到了0.7%,而新出现的网络介质已经超过80%,这反映了词表网络化的趋向,同时也从侧面表现出词表强大的生命力。

表2-4 2006年叙词表的机读版和网络版统计

img5

注:在统计的445部词表中,有155个词表有两种或以上版本,有6个表未出版。

(3)词表更新数和更新频率正在逐年增加。在1996—2003的短短8年间,词表的更新量就猛增了509.1%,而每周更新的词表比例竟达到了12.8%。由此可见,词表更新的数量逐渐增加,更新频率也越来越高。这反映了叙词表强大的发展势头(见图2-2)。

img6

图2-2 叙词表编制年代分布

(4)叙词表的可视化。把可视化技术应用到叙词表中,采用图形化方式展示叙词概念和词间关系,协助读者查询不易表达的检索需求,增加了叙词表的易用性。比如英国文化遗产图示叙词表(Heritage illustrated thesaurus),用于帮助用户建立检索提问和控制检索范围[9]。收到检索提问后,系统搜索机制以图形可视化方式显示遗产叙词,允许用户通过纪念碑的形状特征查询和选择叙词,也可以通过传统的词汇检索方式查询遗产叙词表,以构建检索提问式。文化遗产图示叙词表满足了网络用户对纪念碑的外形和功能的查询需求,如对纪念碑形状、大小、层数、地点等的查询,帮助用户识别纪念碑类型,进而检索到相关信息,受到了用户的赞许,并激发了用户的检索热情[10]

img7

图2-3 英国文化遗产图示叙词表[8]

img8

图2-4 思维导图可视化词典

另一个典型的词表可视化例子是思维导图可视化词典(Thinkmap visual thesaurus),它是一种采用Java语言编写的图形显示工具,综合网络和数据库技术,使从Word Net数据库中检索到的数据集合形成可视拓扑图,使数据集合之间的概念语义网络动态地显示出来[11]

(5)由词表转化为本体。随着各种新技术的出现,对传统情报检索语言的改进、创新和应用也在不断深入。主题图(Topic maps)、主题网关(Subject Gateway)、本体(Ontology),语义网(Semantic Web)等新技术的迅速发展就正好说明了传统情报检索语言将和新技术融合并发展为知识组织系统的趋势。例如,本体就在情报检索语言的基础上为我们提供了更加灵活的组织模型[12]。自语义网提出之后,国内外很多研究机构相继开始了利用现有的叙词表建立本体的尝试,已经有十多种叙词表被各种方法转换为本体(见表2-5)。

表2-5 现有叙词表改造成本体的情况[13]

img9

总之,不论是叙词表在网络环境中的应用与发展,还是叙词表与新技术融合后的创新,都表现出传统情报检索语言的强大发展势头。这表明,以叙词表为代表的情报检索语言不仅不会消亡,反而会在新技术的推动下迅速发展。如曾蕾教授所言:“在我们的网络时代迈向下一代互联网——语义网(Semantic Web)的进程中,KOS的发展和应用再一次走向高潮”[9]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈