首页 理论教育 建筑资源本体建模常用方法

建筑资源本体建模常用方法

时间:2022-02-20 理论教育 版权反馈
【摘要】:基于概念格的异构资源领域本体构建是未来数字图书馆本体构建的必由之路。因此,以“对象一属性相似度”法计算概念相似度,将有利于现代数字图书馆在分布式开放语义环境下构建可互操作的多本体协同系统,最大限度地实现本体复用,从而成为语义网络环境下数字图书馆知识组织的重要解决方案。
数字图书馆的晶格模式(以用户为中心)_连续性资源组织

(一)基于概念格的异构资源领域本体构建(概念—本体)

1.异构资源领域本体构建背景分析

尽管本体作为当前开放语义网络环境下知识描述与知识揭示的主要工具被越来越多的研究者所接受,但是其自身等级制烙印使得知识结构的“逻辑裂隙”一直难以弥合。在本体构建过程中融入概念格,能够借助概念格的层级结构和概念节点间的多重继承关系,能够使生成的目标本体在视觉上更像是一张“网”,而不仅仅是一棵“树”。

将概念格引入本体构建过程中可以解决早期本体构建方法中识别概念之间的关系困难、手工组织概念到本体费时费力和易受开发者的主观影响等问题。随着概念格理论为代表的数据挖掘方法被引入本体构建,使得本体构建的相关研究产生了两条不同的研究路径。一条是以结构化资源为基础的本体构建研究路径,另一条是以非结构化资源为基础的本体构建研究路径(见表6-1[18])。

表6-1 本体构建的研究路径

2.异构资源领域本体构建解决办法(概念格并叠置运算)

近年来,国内外学者也曾试图对两种研究路径进行整合。藤广青博士将这两种本体构建方法进行整合,以图书馆内部两大主要资源,主题词表(结构化)和文本(非结构化)为主,采用形式概念分析的方法,在对主题词表进行形式化和对文本资源进行切词分析的基础上,分别构建基于主题词表的概念格和基于文本资源的概念格,并通过概念格并叠置运算构建目标领域本体(见图6-19[19])。

图6-19 基于概念格的异构资源领域本体构建

3.异构资源领域本体构建实例及意义

藤广青博士以《交通汉语主题词表》(2007年版)中的“客车”主题片段及两段“客车”文本为例,通过概念格构建,并叠置运算获得异构资源概念格,最终转化为基于异构资源的领域本体(见图6-20[20])。

图6-20 单一资源领域本体转化为异构资源领域本体

基于概念格的异构资源领域本体构建符合本体建模的生命周期,本体建模的生命周期一般划分为二个阶段:概念化、模型化、实现。基于概念格的异构资源领域本体构建易于实现计算机自动化处理。利用现有资源构建领域本体,主要需要在三个环节上实现自动化:原始资源的预处理环节(工具:ICTCLAS)、概念格构建环节(工具:ConExp,Lattice Mine)、本体构建环节(工具:Protégé与KOAN)。基于概念格的异构资源领域本体构建是未来数字图书馆本体构建的必由之路。

4.异构资源领域本体构建对连续性资源组织的意义

现实世界中,连续性资源同样是多形式、多结构、多载体的,有期刊分类表、主题词表、期刊文本、期刊数据库;有纸本期刊,有电子期刊等等。在这种情况下,单纯以某一单一结构的连续性资源构建领域本体,即使借助大量领域专家的人工参与,也难以保证领域本体的科学性与完备性,从而难以实现连续性资源组织的科学性和知识服务的高效性。为了能消除连续出版物“数字资源孤岛”和“数字资源超载”现象,综合学术界在单一结构知识资源(主题词表、文本、数据库等)领域本体构建中取得的经验,整合基于不同结构的连续性资源的领域本体的优势,探索异构资源领域本体构建的思路和方法,必然是未来连续性资源领域本体构建的必由之路。

(二)基于概念格的跨本体映射(本体—概念)

1.跨本体映射背景分析

本体(Ontology)作为分布式开放语义网络中知识的表示方法,其目的在于实现人类知识的共享与重用,并因此成为语义网络与数字图书馆研究的核心内容。随着人们对本体相关研究的不断深入,一些比较成熟的本体构建方法和实验本体也相继涌现。然而,由于不同本体的开发目的、应用环境等不尽相同,即使是相同领域或主题的本体间也不免存在一定的语义冲突,进而造成即使同一知识领域的不同本体之间也会存在很大的异构性。这使得本体映射成为各类本体协调(Ontology Mediation)研究重点。

总体而言,通过对当前国际学术界本体协调相关文献的梳理可以看出,本体协调是对不同本体的整合与协同,而本体协调过程中的本体映射则是对不同本体中实体(概念)的匹配与关联。本体协调的处理对象是宏观的本体,而本体映射的处理对象则是微观的处于本体中的实体(概念)。本体映射是本体协调过程中最为基础的环节,并分别融入本体协调的具体的合并、集成与对应的过程中,且担负着不可替代的核心作用(见图6-21[21])。

图6-21 以本体映射为核心的本体协调各要素间关系框架

2.跨本体映射解决办法

与早期本体协调方法不同的是,本体对应不是改造和加工本体,而是通过建立跨本体的映射,最大限度地复用现有本体。而映射关系的核心基础就是不同本体间概念相似度的计算,目前比较有影响的方法有COMA、FOAM、S-MATCH、J/M一Irreducible等,这些计算方法各有优势,但也存在着诸多不足,鉴于此,藤广青提出了以“基于概念格的对象一属性相似度(Object-Attribute Similarity Based on Concept Lattice,OAS)”法计算异构本体间跨本体映射中概念的相似度,并采用斯坦福大学的Prasenjit Mitra等人在本体衔接研究中提供的运输公司(Carrier)和生产厂家(Factory)两个异构本体片段作为测试集,阐明了OAS方法的有效性,并成功地基于该方法建立了跨异构本体的映射关系(见图6-22[22])。

图6-22 基于OAS的不同阈值条件的跨本体映射

3.跨本体映射实例分析

实例研究表明(如图6-22),基于概念格的“对象一属性相似度(Object-Attribute Similarity,OAS)”法,在支持异构本体间跨本体映射的构建中具有独特的优势。该方法扩展和完善了概念格与本体互补融合的领域范畴,高度形式化地综合了概念相似度的主要要素指标,保障了跨本体映射的偏序关系。因此,以“对象一属性相似度(OAS)”法计算概念相似度,将有利于现代数字图书馆在分布式开放语义环境下构建可互操作的多本体协同系统,最大限度地实现本体复用,从而成为语义网络环境下数字图书馆知识组织的重要解决方案

4.跨本体映射对连续性资源组织的意义

连续性资源作为数字图书馆很重要的组成部分,同样可以用基于OAS法的本体映射来构建连续性资源中的多本体协同系统,实现连续性资源的本体复用,可见,本体映射也是连续性资源的一种重要的知识组织模式。

(三)多本体协同知识地图

1.多本体协同知识地图研究国内外现状分析

早期的多本体协同的相关研究主要脱胎于本体合并(Ontology Merging)和本体对应(Ontology Alignment/Matching),然而,当前国际学术界关于本体间协同的相关研究更多地集中于本体对应(Ontology Alignment/Matching)方面,FOAM、OLA、COMA、OMAP、S-MATCH等一系列聚焦于本体对应的新颖的多本体协同方法相继诞生。

相比国外本体协同研究领域较丰富的研究成果,国内的研究现状相对比较滞后,大多数文献主要集中于对现有本体映射和概念相似度计算方法的阐释和改进。近年来也有悄然转向从多本体协同的角度对本体映射展开研究,纵观合国内外在统一的知识地图中全局呈现异质本体协同关系的相关研究更可谓凤毛麟角。

2.多本体协同知识地图实现模式及实例

鉴于此,藤广青在对多本体协同知识组织的相关研究状况进行了考察的基础上,遴选了国际生物医学领域两个比较著名的领域本体Plant Environmental Conditions和Environment Ontology作为研究对象,在共同语义基础上对异质领域本体的概念格解析,通过将WordNet的偏序结构嵌入领域本体后构建的概念格,在不破坏偏序关系的情况下获得本体中相关概念的外延与内涵,进而借助基于对象(外延)与属性(内涵)的概念相似度计算方法建立跨本体的映射,并最终构建多本体协同知识地图,实现跨越异质本体的知识呈现与知识检索(见图6-23[23])。

图6-23 多本体协同知识地图

3.多本体协同知识地图对连续性资源组织的现实意义

现实世界中,同样存在各类、各形式的连续性资源的异质本体,通过多本体协同知识地图,不断可以展示连续性资源领域的知识结构和知识间的关联关系,更为最为重要的是,它可以保持原有其中某连续性资源本体结构的情况下实现跨越领域本体的本体通信与本体协同,最大限度地实现了连续性资源本体复用。最后通过构建本体协同知识地图,使连续性资源的知识组织超越本体规模的极限,使连续性资源的知识地图以“拼图”的形式不断地拓展和延伸(见图6-24)。

图6-24 连续性资源本体复用

(四)未来连续性资源组织的方向

多本体协同知识地图固然可以实现连续性资源知识组织的可视化展示,也可以帮助用户实现连续性资源的知识定位,但在浩瀚的连续性资源的知识海洋中,用户的知识检索与获取行为更需要个性化与定制化的可视化导航服务。数字图书馆中连续性资源知识组织的最终目标毕竟是以人为本,为用户提供知识服务,因此如何在多维度语义聚合的情况下,从知识组织的可视化到用户需求分析的可视化,再到检索结果的可视化,将是未来数字图书馆中连续性资源知识组织与服务的一个新的研究热点,这也是未来连续性资源组织的方向(见图6-25[24])。

图6-25 语义环境下连续性资源组织的方式和模型

【注释】

[1]杜鹃.基于语义网格的知识地图资源组织研究与应用[D],哈尔滨:哈尔滨工程大学,2012

[2]王健.基于本体的图书馆Folksonomy信息组织优化研究[D],长春:吉林大学,2012

[3]陈开慧.本体与分众分类的融合模型研究[J],图书馆学研究,2013(5).

[4]陈开慧.本体与分众分类的融合模型研究[J],图书馆学研究,2013(5).

[5]陈开慧.本体与分众分类的融合模型研究[J],图书馆学研究,2013(5).

[6]http://www.cadal.zju.edu.cn/QuickSearch.action

[7]王硕,周华琳.基于语义搜索引擎的数字图书馆服务优化研究[J],图书馆学研究,2012(14).

[8]王硕,周华琳.基于语义搜索引擎的数字图书馆服务优化研究[J],图书馆学研究,2012(14).

[9]王硕,周华琳.基于语义搜索引擎的数字图书馆服务优化研究[J],图书馆学研究,2012(14).

[10]王硕,周华琳.基于语义搜索引擎的数字图书馆服务优化研究[J],图书馆学研究,2012(14).

[11]王硕,周华琳.基于语义搜索引擎的数字图书馆服务优化研究[J],图书馆学研究,2012(14).

[12]杜鹃.基于语义网格的知识地图资源组织研究与应用[D],哈尔滨:哈尔滨工程大学,2012

[13]杜鹃.基于语义网格的知识地图资源组织研究与应用[D],哈尔滨:哈尔滨工程大学,2012

[14]藤广青.基于概念格的数字图书馆知识组织研究[D],长春:吉林大学,2012

[15]甘特尔B,威尔R.形式概念分析[M].马垣,张学东,迟呈英等译.北京:科学出版社,2007.

[16]藤广青,毕强.基于粒度概念分析法的文献关键词分析:以Ontology领域关键词为例[J],现代图书情报技术,2011,27(9).

[17]藤广青,毕强.基于粒度概念分析法的文献关键词分析:以Ontology领域关键词为例[J],现代图书情报技术,2011,27(9)

[18]藤广青.基于概念格的数字图书馆知识组织研究[D],长春:吉林大学,2012

[19]藤广青,毕强.基于概念格的异构资源领域本体构建研究[J],现代图书情报技术,2011,27(5)

[20]藤广青.基于概念格的数字图书馆知识组织研究[D],长春:吉林大学,2012

[21]藤广青.基于概念格的数字图书馆知识组织研究[D],长春:吉林大学,2012

[22]藤广青.基于概念格的数字图书馆知识组织研究[D],长春:吉林大学,2012

[23]藤广青.基于概念格的数字图书馆知识组织研究[D],长春:吉林大学,2012

[24]韩毅.语义网格环境下数字图书馆知识组织策略与应用研究[D],长春:吉林大学,2008

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈