首页 理论教育 空间信息语义网格

空间信息语义网格

时间:2022-03-04 理论教育 版权反馈
【摘要】:但对于空间信息系统来说,仅仅做到这一步是不够的,更重要的是解决语义异构,实现语义信息的共享,使得不同行业的空间信息系统在纳入网格系统时就必须考虑语义的差异。空间信息语义网格追求的最终目标是把Internet上的空间信息服务站点在语义层连接起来,实现基于语义的集成和互操作。为了构造语义网格系统,笔者把本体全面引入网格的体系结构,形成了基于本体的空间信息语义网格体系结构。

空间信息语义网格

借助Internet技术,空间信息系统实现了地域空间信息的对外发送,但各个地域的空间信息系统往往仅存储当地的空间信息,目前尚无任何一个空间信息系统拥有地球上全部的海量信息。为获取所需的资源,用户只能人工地从大量的空间信息系统网站中逐个查询,这样不仅浪费时间,而且由于缺乏目的性,用户往往无法获得需要的信息。为解决这个矛盾,需要建立开放分布的跨地区、跨行业的网络化空间信息系统,使用户透明地使用网络上所有的空间信息资源。网格应用[1]的兴起为该问题的解决提供了较为理想的方案。网格是把整个Internet整合成一台巨大的超级计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享[2]。网格的根本特征并不是它的规模,而是资源共享,消除资源孤岛。这种开放透明的共享资源模式决定了网格与空间信息系统结合的必然性[3~5]。目前,空间信息网格的研究主要集中在解决不同计算资源的连接上,以便用户可以透明和无缝地使用网格上的所有资源。这种解决问题的途径在科学计算领域是成功的,但对空间信息系统来说,仅仅把它们无缝地连接起来是不够的。由于人们对世界认知的不同,导致对同一地理现象观察和描述会侧重于对象不同的侧面,从而产生观点上的差异,形成语义异构。不同行业的空间信息系统对同一个概念的语义解释往往有很大的差别,如果不考虑这种语义的差异,就可能对用户的要求无法回答或做出不正确的回答。为此,本文首次将本体(ontology)引入网格系统,力图构造一个具有语义共享的空间信息语义网格系统。

1 网格与本体

1.1 网格的概念与结构

1998年,Forster首次提出了网格的概念[6]:一个计算网格是一个提供可靠、稳定、普及和廉价使用高端计算能力的软硬件基础设施。2000年,Forster再次修改了网格的概念[7]:网格是分布并行的资源系统,它使用标准、开放、通用协议和界面来提供非凡的服务。

从上述定义的演变可以发现,网格的定义从系统组成逐步演变为描述其本质内涵——分布资源和服务的共享。在网格结构的研究中,影响较大的是美国Globus项目提出的“漏斗”模型,它包含网格纤维层、网格连接层、网格资源层、网格聚集层和网格应用层五层结构[1]。其中核心部分是聚集层,这层的作用是将资源层提交的受控资源汇集在一起,供虚拟组织的应用程序共享、调用。为了对来自应用的共享进行管理和控制,聚集层提供目录服务、资源分配、日程安排、资源代理、资源监测诊断、网格启动、负荷控制、账户管理等多种功能。总之,网格应用的目的是使用户通过网格透明地调用网格上的各种信息和相应的服务,充分利用网格上的所有适用的设备对用户的问题进行计算,使其不需购置昂贵的设备便可实现自己的需求。

从上述分析可以看出,目前网格的研究主要集中在解决不同硬件资源的连接上,以便用户可以透明和无缝地使用网格上的所有硬件资源。但对于空间信息系统来说,仅仅做到这一步是不够的,更重要的是解决语义异构,实现语义信息的共享,使得不同行业的空间信息系统在纳入网格系统时就必须考虑语义的差异。

1.2 本体

在空间信息系统领域,根据人们对同一地理对象的观点的异同将其分为不

同地理信息团体GIC[8](geospatial information communities)。一个GIC是共享相同地理本体的空间数据的提供者和用户组,在每个GIC内部,本体被视为共享的知识库。而不同GIC的本体之间存在着信息和服务交流的需求,就产生了空间信息系统语义层集成和互操作问题。

在关于本体的定义[9,10]中,被广泛接受的是:一个本体是一个共享概念化模型的形式化和显式的说明规范[11]。“概念化模型”表示现实世界中被研究客体的抽象;“显式”意味着概念类型的使用及使用的约束有明确的定义;“形式化”指本体应该是机器可以理解的,即计算机应该能够解释信息提供的语义;“共享”表明本体描述的知识是被团体共同认可的,而不仅仅是个体观点的表达。因此本体由一组概念和概念之间的关系组成,形式上表现为关于概念的词汇表。

本体结构是按层次方式组织的,本体的概念(类)之间存在同义关系和蕴含关系。同义关系表示两个概念(类)语义相同,蕴含关系表示两个概念(类)是继承关系。图1描述了一个根据林业部土地分类原则[12]建立的本体系统的层次结构。

从图1可以看出,本体类之间的关系通过类的层次结构表示;而类的语义通过该类的属性和属性值表示,这样就把本体类的内涵和类之间的关系显式和形式化地表达出来。

构造一个本体,意味着将人类对客观世界的认知模型映射成计算机能够处理的形式,使计算机掌握了分析、加工和传递语义信息的能力。如果把本体与网格结合起来,就可能构造一个基于语义的空间信息语义网格,为实现基于语义的空间信息系统的集成和互操作开辟新途径。

img40

图1 系统本体层次模型

2 基于本体的空间信息语义网格

2.1 空间信息语义网格的概念

经过综合分析,笔者认为,空间信息语义网格就是在利用现有的空间信息基础设施、空间信息网络协议规范的基础上,引入描述空间信息语义的本体系统,为用户提供基于语义的一体化空间信息应用服务的信息平台。在这个平台上,空间信息处理是基于语义和分布式协作的,用户可以在空间信息的语义层从单一的逻辑门户透明地对所有空间信息资源实现基于语义的访问。空间信息语义网格追求的最终目标是把Internet上的空间信息服务站点在语义层连接起来,实现基于语义的集成和互操作。

2.2 语义网格的体系结构

为了构造语义网格系统,笔者把本体全面引入网格的体系结构,形成了基于本体的空间信息语义网格体系结构。语义网格分为三个大的层次:用户应用层、网格管理层和网格基础层,各个层次又由更细微的层次构成,如图2所示。

基础层(fabric)由网络硬件、GIS节点、数据与本体的中间件Mediator、节点本体和节点本体-通用本体桥组成。通过上述软硬件设施,可以实现各个节点的物理连接,但从逻辑上看,这些地理信息仍然是孤立的,未能解决信息共享的问题。

网格管理层包括安全机制、注册注销机制、资源管理和服务调度。主要负责管理各个分布异构的GIS节点和用户之间的交流,为用户提供透明的基于语义的服务,从而对用户的应用形成一个虚拟的同构环境。其功能是屏蔽网格基础设施中空间信息的分布、异构特性,消除语义歧义。

img41

图2 基于本体的语义网格层次结构

应用层包括用户界面和领域-通用本体转换桥。其功能是为领域用户提供个性化的界面和由领域概念到通用概念的转换。

空间信息语义网格与计算网格最大的区别是对用户的基于语义的透明性,信息语义的载体-本体全面渗透到网格的体系结构中。

2.3语义网格的特征

与普通的计算网格相比,语义网格具有以语义为中心的特点,整个结构和运行机制都以本体为核心。语义网格的资源管理包括基于语义的资源注册、管理和调度,其中关键的步骤在于两个本体转换桥的功能,领域(节点)本体-通用本体转换桥实现领域本体到通用本体的互换,转换原则可用逻辑推理的方式[13]导出。通过两次转换后网格系统屏蔽了各个节点本体的特性,对用户呈现出一个虚拟和单一的语义资源,保证了用户对资源使用的透明性。具体描述如下。

空间信息语义网格利用Mediator部件和本地本体对具体的GIS系统进行语义封装。其中本地本体是本地GIS系统的知识库,它描述了本地(领域)地理信息团体(GIC)对世界的共享观点,而Mediator则将本体中的概念与底层的GIS数据联系起来,这样就利用本地本体将GIS系统封装起来,对外显示出用本体概念描述的地理世界。在此基础上,空间信息语义网格的资源管理采用推和拉相结合的方法进行资源管理和调度[14],各个GIS节点自动发布关于本节点空间信息资源的本体元数据,元数据经过本体转换桥转换为通用本体描述的形式后,注册到用通用本体概念描述的资源元数据库中,这个过程是把各个网格节点本体元数据“推”到通用本体资源元数据库中,而用领域本体描述的各个领域的用户应用。在经过本体转换桥翻译成用通用本体描述的查询或对数据的操作后,在资源管理元数据库中查询所有注册的节点元数据,寻找满足用户要求的GIS节点,然后对选定的GIS节点进行信息的读取和加工后返回结果,这是用户应用对信息进行“拉”的过程。通过这种方法,任何领域的用户都可以使用所有在资源信息库中注册的不同节点的GIS信息。由于信息的注册和读写是基于本体的,所以是在语义层进行的,语义信息的载体-本体自始至终发挥着主导的作用,保证了用户的语义被忠实地贯彻到每一个环节,避免了用户需求的语义失真,实现了基于语义的集成和互操作。

3 实例分析

在土地利用分析中,林业部门根据《中华人民共和国森林法实施条例》[15]把林地分为包括郁闭度为0.2以上的乔木林地以及竹林地、灌木林地、疏林地、采伐火烧迹地、未成林造林地、苗圃地和宜林地。而农业部门根据《中华人民共和国草原法》[16]把草原分为天然草原和人工草地,其中天然草原包括草地、草山和草坡,人工草地包括改良草地和退耕还草地。因为依据的法规不同而导致两个部门在进行土地利用分类时常常产生分歧,比如对于亚热带丘陵山地,林业部门将其划为宜林地,而农业畜牧部门将其划为草山、草坡。这就造成同一块土地在不同的部门有语义不同的分类,彼此很难进行集成和互操作。本文为了解决这一类矛盾,消除语义冲突,在建立林业本体系统和农业本体系统的基础上构造一个通用本体系统,从而建立一个基于语义的网格系统,使得相关概念在不同部门本体系统之间可以进行语义转换,从而实现基于语义的集成和互操作。

本体是一个共享概念化模型的形式化和显式的说明规范,由一组概念和概念之间的关系组成,形式上表现为关于概念的词汇表。本体结构是按层次方式组织的,本体的概念(类)之间存在同义关系和蕴含关系。同义关系表示两个概念(类)语义相同,蕴含关系表示两个概念(类)是继承关系。

根据上述分析分别建立林业和农业本体系统,林业本体系统包含两层类层次结构。林地类是有林地、竹林地、灌木林地、疏林地、迹地、未成林造林地、苗圃地和宜林地类的父类;而农业本体系统中,存在三层类层次结构,草原类包括天然草原和人工草地类。天然草原类是草地、草山和草坡等类的父类,人工草地类是改良草地和退耕还草地类的父类。建立通用本体就是求不同本体系统的并集的过程,具体步骤分为两步:①求两个本体系统的交。与ONION系统不同的是,节点交集没有新增节点,而是通过在两个本体系统之间建立概念之间的同义或上下义语义关系,并且把上述语义关系通过增加两个本体系统间的边的方式表达出来。②建立两个本体的交。交集是两个本体系统加上它们之间的边集,运算结果如图3所示。

img42

图3 通用本体系统

通过上述操作,两个本体系统被集成到一个统一的系统中,整个土地利用类包括林地类和草原类。林地类是有林地、迹地、未成林造林地、灌木林地、疏林地和苗圃地的父类,它们来自林业本体。草原是天然草原和人工草地的父类,来自农业本体。除了各自本体系统存在的自上而下的一对多的关系外,统一本体系统还存在横向的联系,如林地与草山草坡是同义关系,灌木林地和疏林地是林间草地的父类。这些关系(概念节点之间的边)是林业和农业本体之间的交集。

通过上述分析,可以得出两个领域本体各自与通用本体之间的语义关系:

宜林地=草山草坡

灌木林地∈林间草地

疏林地∈林间草地

在基于本体的空间信息语义网格中,该查询按下列步骤进行。

1)个性化用户注册。不同领域的用户在统一的界面中注册,应用界面根据注册信息启动相应领域的本体系统供用户用来表达需求,实现个性化注册。

2)通过领域-通用本体桥,把领域本体表述的用户需求转换为通用本体语言描述。由于宜林地本身就是通用本体的概念,所以不需要概念转换,用户查询语句形式不变。

3)在网格管理层搜索合适的网格节点。通过查询资源元信息库各个节点的注册信息,寻找满足用户需求的GIS节点。由于林业本体系统的宜林地和农业本体系统的草山草坡以同义词的形式注册,所以农业和林业节点被选择。

4)用户需求由统一本体系统转换到选定的节点本体。目标节点选定后,把用户的需求从通用本体描述的形式转换为目标节点(农业和林业本体)的本体描述形式。

5)分别在林业和农业GIS节点利用Mediator部件,查找与本体概念对应的数据,并按用户的要求对数据加工。

6)结果逐级返回,格式转换融合后给用户。

查询过程涉及不同GIS节点的数据,并且对用户是透明的,用户并不知道数据来自哪一个GIS节点。对用户而言,整个操作是基于语义的,并且与单机版的GIS系统查询没有任何区别。同时,上述操作首先进行概念之间的语义转换和匹配,待确定目标概念后才通过概念与具体数据之间的中间件Mediator获得具体的GIS数据,所以整个操作是基于语义的,实现了不同部门(如农业和林业部门)之间基于语义的集成和互操作。

4 结语

本文结合空间信息的特殊性,对网格的语义集成和互操作进行了一些探讨,论证了在空间信息语义网格中,通过领域(节点)本体与通用本体之间的转换,屏蔽空间信息资源的分布特征和异构特征,从而在逻辑上为用户提供了一个虚拟的单一空间信息视图;而基于本体的资源管理调度、注册和服务机制,使所有的操作都是基于语义的,实现了基于语义的网格计算和广域环境下的空间信息资源的集成与互操作。传统互联网实现了计算机硬件的连通,Web实现了网页的连通,网格试图实现互联网上所有资源的全面连通,而空间信息语义网格则要实现全球空间信息在语义层的全面连通。随着网格规模的扩张,将会遇到如何解决用不同的自然语言描述的地理实体之间如何准确地交流的问题,即需要解决多语言本体系统之间的语义转换和匹配问题,除了正确地利用不同语言文字属性表达空间实体的语义外,还应考虑把符号、图标和图像引入本体的语义表达中。

参考文献

[1]Foster I,Kesselman C,Tuecke S.The Anatomy of the Grid:Enabling Scalable Virtual Organizations.Intel Supercomputer Applications,2001,15(3):120-130

[2]李国杰.信息服务网格——第三代Internet.http://moilaetitia.topcities.com/grid/ liguojie.html,2001

[3]李德仁,朱欣焰,龚健雅.从数字地图到空间信息网格—空间信息多级网格思考.武汉大学学报·信息科学版,2003,28(6):642-650

[4]夏曙东,李琦,承继成.空间信息格网框架体系和关键技术分析.地球信息科学,2002(4):30-35

[5]孙九林,李爽.地球科学数据共享与数据网格技术.中国地质大学学报,2002,27(5):539-543

[6]Foster I,Kesselman C.The Grid:Blueprint for a New Computing Infrastructure.New York: Morgan Kaufmann,1998.11-156

[7]Foster I.What Is the Grid?A Three Point Checklist.http://www-fp.mcs.anl.gov/~foster/ articles,2003

[8]Buehler K,Mckee L.The Open GIS Guide(Third Edition).http://www.opengis.org,2002

[9]Uschold M.Knowledge Level Modelling:Concepts and Terminology.The Knowledge Engineering Review,1998,13(1):5-29

[10]Chandrasekaran B,Josephson J R,Benjamins V R.What are Ontologies,and Why Do We NeedThem?http://www.informatik.uni-hamburg.de/WSV/teaching/proseminare/ NavigationWebArtikel/chandrasekaranetal99.pdf,2002

[11]Gruber T.Towards Principles for the Design of Ontologies Used for Knowledge Sharing.International Journal of Human-Computer Studies,1995,5(6):907-928

[12]中华人民共和国国务院.中华人民共和国森林法实施条例.http:// www.china.com.cn/market/lxcp/390278.html,2003

[13]崔巍.基于地理本体的GIS语义互操作研究.测绘信息与工程,2004(1):20-22

[14]武秀川,鞠九滨.计算网格的资源分发与发现机制.计算机科学,2003,30(1): 12-24

[15]全国人民代表大会常务委员会.中华人民共和国草原法.http://www.agri.gov.cn/ zcfg/t20020916_3269.html,2003

(合著者:崔巍)

(武汉大学学报·信息科学版,2004,29(10))

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈