首页 百科知识 开放式地理信息系统理论研究

开放式地理信息系统理论研究

时间:2022-10-18 百科知识 版权反馈
【摘要】:本节简要介绍传统GIS基本理论与方法,包括空间数据基本特征、空间数据模型、空间数据管理等,在此基础上,回顾地理信息系统体系结构的演变,指出互操作是开放式地理信息系统的核心。在当前通用的关系数据库管理系统中,数据记录一般是结构化的。一个城市地理信息系统的数据量可能达几十GB,如果考虑影像数据的存储,可能达几百个GB。
开放式地理信息系统理论研究_网络地理信息系统

1.2.1 开放式地理信息系统理论研究

本节简要介绍传统GIS基本理论与方法,包括空间数据基本特征、空间数据模型、空间数据管理等,在此基础上,回顾地理信息系统体系结构的演变,指出互操作是开放式地理信息系统的核心。

1.2.1.1 空间数据基本特征

在地理信息系统中,对空间目标描述的数据类型有三种:空间特征数据、时间属性数据和专题属性数据。一般把时间属性数据和专题属性数据视为属性特征数据,把空间特征数据和属性特征数据统称为空间数据或地理数据。

归纳起来,空间数据具有以下5个基本特征(龚健雅,2001):

1.空间特征

每个空间对象都具有空间坐标,即空间对象隐含了空间分布特征。这意味着在空间数据组织方面,要考虑它的空间分布特征。除了通用数据库管理系统或文件系统关键字的索引和辅关键字索引以外,一般需要建立空间索引。

●抽象性:不同的抽象,同一自然地物表示可能会有不同的语义。如河流既可以被抽象维水系要素,也可以被抽象为行政边界,如省界、县界等。

●多尺度:不同的观察尺度具有不同的比例尺和不同的精度,同一地物在不同的情况下就会有形态差异。

●多时空性:一个GIS系统中的数据源既有同一时间不同空间的数据系列;也有同一空间不同实际序列的数据。

●数据分布不均匀:局部数据相对稠密,而另外的区域却相对稀疏;部分对象相对复杂,而另外的对象却又相对简单。

2.非结构化特征

在当前通用的关系数据库管理系统中,数据记录一般是结构化的。即它满足关系数据模型的第一范式要求,每一条记录是定长的,数据项表达的只能是原子数据,不允许嵌套记录。而空间数据则不能满足这种结构化要求。若将一条记录表达一个空间对象,它的数据项可能是变长的,例如,1条弧段的坐标,其长度是不可限定的,它可能是2对坐标,也可能是10万对坐标;其二,1个对象可能包含另外的1个或多个对象,例如,1个多边形,它可能含有多条弧段。若1条记录表示1条弧段,在这种情况下,1条多边形的记录就可能嵌套多条弧段的记录,所以它不满足关系数据模型的范式要求,这也就是为什么空间图形数据难以直接采用通用的关系数据管理系统的主要原因。

3.空间关系特征

空间数据除了前面所述的空间坐标隐含了空间分布关系外,空间数据中记录的拓扑信息表达了多种空间关系。这种拓扑数据结构一方面方便了空间数据的查询和空间分析,另一方面也给空间数据的一致性和完整性维护增加了复杂性。特别是有些几何对象,没有直接记录空间坐标的信息,如拓扑的面状目标,仅记录组成它的弧段的标识,因而进行查找、显示和分析操作时都要操纵和检索多个数据文件方能得以实现。

4.分类编码特征

一般而言,每一个空间对象都有一个分类编码,而这种分类编码往往属于国家标准,或行业标准,或地区标准,每一种地物的类型在某个GIS中的属性项个数是相同的。因而在许多情况下,一种地物类型对应于一个属性数据表文件。当然,如果几种地物类型的属性项相同,也可以多种地物类型共用一个属性数据表文件。

5.海量数据特征

空间数据量是巨大的,通常称海量数据。之所以称为海量数据,是指它的数据量比一般的通用数据库要大得多。一个城市地理信息系统的数据量可能达几十GB,如果考虑影像数据的存储,可能达几百个GB。这样的数据量在城市管理的其他数据库中是很少见的。正因为空间数据量大,所以需要在二维空间上划分块或者图幅,在垂直方向上划分层来进行组织。

1.2.1.2 空间数据模型

空间数据模型是对现实世界部分现象的抽象,它描述了现实世界中空间实体及其相互关系。空间数据模型为空间数据的组织和空间数据库的设计提供基本的方法,对地理空间数据库系统内部以及内部和外部之间进行数据交换和数据共享意义重大。空间数据模型可以分为栅格模型和矢量模型,两者最根本的区别在于它们如何表达空间概念。

1.基于要素的矢量数据模型

矢量数据模型将现象看做离散原型实体的集合,因此可以看成是基于要素的。在二维模型内,原型实体是点、线和面;而在三维模型内,原型实体也包括表面和体。矢量模型的表达源于原型空间实体本身,通常以坐标来定义。原型实体与其属性构成了表达一个空间对象的要素。矢量数据模型按其发展历史可以分为以下三个阶段(闾国年等,2007):

(1)CAD数据模型。源于20世纪70年代通用的计算机辅助设计(CAD)软件。其侧重于地理信息的图形表示,空间数据不存储在数据库中,并且通常缺乏对属性数据的支持。

(2)地理关系模型(Georelational Data Model)。以美国ESRI公司早期商业GIS软件ARC/INFO的Coverage数据模型为代表。其将几何图形数据与属性数据关联,图形数据放在建立索引的二进制文件中,并保存矢量数据间的拓扑关系,属性数据放在关系数据库管理系统中。

(3)面向对象模型(GeoDatabase)。在ESRI的后期GIS软件ArcGIS中,GeoDatabase模型利用面向对象技术把现实世界抽象为若干对象类。具有相同属性集、行为和规则的空间对象集合体现为要素类。要素类中的要素集合具有相同的空间参考特征。

2.基于场(Field)的栅格数据模型

栅格数据模型是基于连续铺盖的,它将连续空间离散化,即用二维或三维铺盖划分覆盖整个连续空间。地理空间中的现象作为连续的变量或体来看待,如大气污染程度、地表温度、土壤湿度、地形高度以及大面积空气和水域的流速和方向等。一个二维场就是在二维空间中任意给定的一个空间位置上,都有一个表现某现象的属性值,即A=f(x,y)。一个三维场是在三维空间中任意给定一个空间位置上,都对应一个属性值,即A=f(x,y,z)。栅格数据模型把空间看做像元的划分,每个像元都与分类或者标识所包含的现象的一个记录有关。栅格数据模型描述的就是二维或三维空间中连续变化的数据。

1.2.1.3 空间数据管理

由于空间数据的特殊性,尤其空间坐标的非结构化特征,使空间数据的管理有别于其他的信息系统对数据的管理。同时,空间数据的管理,也随着其他的技术发展而变化,如数据库技术(龚健雅,2001)。

1.文件系统

早期的GIS软件对空间、属性、影像、多媒体数据都是由文件系统进行存储,文件格式以及数据组织由自己定义。

这种方式在数据量不是很大、对数据不涉及并发操作等情况下,可以发挥积极的作用,如ARC/INFO、MapInfo等软件都有自己的文件格式存储空间数据。但随着GIS数据的激增和数据类型的多元化以及GIS数据网上发布等新特征的出现,这种管理模式已经不能适应GIS软件的要求。

2.文件与关系数据库混合管理系统

在这种管理模式中,文件系统管理空间数据,关系数据库管理属性数据,它们之间一般通过对象标识符(OID)来关联。如图1.4所示。

img5

图1.4 GIS中图形数据与属性数据的连接

这种管理模式虽然使用了关系数据库,但由于空间数据和属性数据是由文件系统和数据库分别管理,因而在数据的安全性、一致性、完整性、并发控制、灾难恢复等方面不能充分利用关系数据库所提供的比较成熟的功能。可以说,这种混合管理系统比较脆弱,仍然远远不能满足现在对空间数据管理的要求。而以往的网络分析模型大多是建立在这种模式的基础上。

3.全关系型空间数据库管理系统

全关系型空间数据库管理系统是指图形和属性数据都用现有的关系数据库管理系统管理。关系数据库管理系统的软件厂商不作任何扩展,由GIS软件商在此基础上进行开发,使之不仅能管理结构化的属性数据,而且能管理非结构化的图形数据。

用关系数据库管理系统管理图形数据有两种模式:

(1)图形数据按照关系数据模型组织,利用关联表的方式进行管理。

对每一个空间表,都有另外一个表通过OID与此表关联。几何坐标将存放在这个关联表中,所有的几何对象都看成是由点构成,每个点的XY和XYZ存放为一行,有多少个点就存放多少行。获取空间数据时进行join运算,显然,这种关系连接运算比较复杂,非常费时。由此可见,关系模型在处理空间目标方面效率不高。

(2)利用BLOB等大二进制数据类型。

目前大部分关系数据库管理系统都提供了二进制块的字段域,以适应管理多媒体数据或可变长文本字符。GIS利用这种功能,通常把图形的坐标数据,当做一个二进制块,交由关系数据库管理系统进行存储和管理。这种存储方式,虽然省去了前面所述的大量关系连接操作,但是二进制块的读写效率要比定长的属性字段慢得多,特别是牵涉对象的嵌套,速度更慢。

4.对象关系数据库管理系统

由于直接采用通用的关系数据库管理系统的效率不高,而非结构化的空间数据又十分重要,所以许多数据库管理系统的软件商纷纷在关系数据库管理系统中进行扩展,使之能直接存储和管理非结构化的空间数据,如DB2、Informix和Oracle等都推出了空间数据管理的专用模块,定义了操纵点、线、面、圆、长方形等空间对象的API函数。

这些专用模块都提供了强大的空间数据管理、空间分析、索引维护等功能,为用户提供了极大的便利。而且,这种扩展的空间对象管理模块解决了空间数据变长记录的管理,由于由数据库软件商进行扩展,它的效率要比二进制块的管理高得多,目前已开始得到广泛使用。

但是它没有解决对象的嵌套问题,空间数据结构不能由用户任意定义,拓扑关系无法表达,使用上仍然受到一定限制。例如对于网络分析功能,需要GIS软件商独立地开发相应的模块加以实现。

5.面向对象空间数据库管理系统

面向对象模型最适应于空间数据的表达和管理,它不仅支持变长记录,而且支持对象的嵌套、信息的继承与聚集。面向对象的空间数据库管理系统允许用户定义对象和对象的数据结构以及它的操作。这样,我们可以将空间对象根据GIS的需要,定义出合适的数据结构和一组操作。这种空间数据结构可以是不带拓扑关系的数据结构,也可以是拓扑数据结构,当采用拓扑数据结构时,往往涉及对象的嵌套、对象的连接和对象与信息聚集。但由于面向对象数据库管理系统还不够成熟,目前在GIS领域还不太通用,基于对象关系的空间数据库管理系统成为GIS空间数据管理的主流。

1.2.1.4 地理信息系统体系结构

地理信息系统软件的体系结构与信息技术的发展密切相关,历经了单机模式的集中管理、客户/服务器体系结构、分布式服务架构

1.单机模式的集中管理

传统的单机版GIS软件数据和应用程序是集中管理的,其结构简单,便于实现,且在特定的硬件环境支持下运行效率高,便于维护。但是系统仅适用于具备GIS专业知识的用户,用于完成小型的应用工程。并且,很难实现不同GIS系统之间的互操作和数据共享,这就造成了系统的重复开发和数据重复生产,大大提高了GIS系统的开发成本。

2.客户/服务器体系结构

许多已有的网络GIS应用遵循客户/服务器体系结构。在该结构下,数据存储、处理等功能由服务器负责,数据表现等功能在客户机例如网络浏览器执行(Abel等,1998)。为了提高用户交互的性能,也可以将部分数据操作功能放在客户端。根据客户端和服务器端功能负荷的轻重,可以将客户端和服务器端分别划分为“瘦”/“胖”客户端和“轻”/“重”服务器(Chang和Park,2006)。例如一些轻量级的数据处理功能可以在客户端执行,而复杂的数据处理功能,正如目前许多网络GIS软件产品所实现的,放在服务器端执行。

3.分布式服务架构

分布式服务架构早期是随分布式对象技术发展起来。分布式对象技术是分布式计算技术与面向对象技术的结合。在开发大型分布式组件系统中逐渐形成了3种具有代表性的主流分布式对象中间件技术,即对象管理组织OMG的COBRA技术、Microsoft的DCOM和Sun公司的EJB技术(Tsou和Buttenfield,2002;Preston等,2003)。然而,这些技术各自有一套独立的体系结构和私有协议,服务的客户端与系统提供的服务之间采用紧密耦合的模式,基于不同技术的应用系统之间通信十分不便。后期发展起来的网络服务技术,采用的协议具有通用性,服务间采用松散耦合的模式,具有完全的平台、语言独立性,成为分布式服务架构的主流技术。

1.2.1.5 地理信息互操作

GIS虽然得到了广泛的应用,其使用范围已经涉及多个部门和学科,在资源管理、环境监测、防灾减灾等领域已经发挥着重要的作用,但是,由于多方面的原因,GIS应用系统被认为是信息孤岛。现有的GIS数据来源于多种渠道,有地图数据、影像数据、地形数据等。数据内容与来源的差异性为数据的处理带来了难度。空间数据模型存在差异,有拓扑和无拓扑空间数据模型、二维和三维空间数据模型、时空数据模型等,应用部门在开发地理信息系统时通常是依据本部门的空间数据格式,对地理数据的组织有很大的差异,使得不同的GIS软件数据交换存在困难。各个地理信息系统是独立开发的,没有统一的标准,支持的平台各不一样,使得各系统之间数据共享和互操作存在障碍。这些问题归根到底是地理信息系统间的互操作问题,互操作是系统集成的基础(胡鹏等,2002)。

在《计算机辞典》中,将互操作定义为两个或者多个系统交换信息并相互使用交换信息的能力,即指一个系统接收和处理另一软件系统发送信息的能力,它反映了一个系统是否易于与其他软件系统快速连接,它是衡量软件质量的一个重要指标。国际地理信息联盟OGC认为地理信息系统互操作就是不同地理信息系统开发商生产的软件系统通过一致的、开放的接口进行交互的能力。

地理信息系统互操作在不同的情况下具有不同的侧重点,在强调软件功能块之间相互调用时称为软件的互操作;在强调数据集之间的相互透明地访问时称为数据的互操作;在强调信息的共享,在一定语义约束下的互相操作称为语义的互操作(龚健雅等,2009)。目前地理信息系统的互操作强调地理空间数据和处理功能的共享。通过互操作实现不同GIS软件产品管理的数据和处理资源的集成,从而推动可互操作的地理信息处理软件和地理信息产品在各个领域中的广泛应用。

空间数据共享与互操作的模式主要有以下几种:

(1)空间数据格式转换模式。例如Arc/Info的E00模式、ArcView的Shape格式、MapInfo的Mif格式。

(2)直接数据访问模式。例如Intergraph的GeoMedia实现了对大多数GIS/CAD软件数据格式的直接访问。SuperMap 2.0则提供了存取MapInfo、OracleSpatial、ESRI ArcSDE、SuperMap SDB文件等的API函数。GeoStar提供了读取ArcInfo的shapefile和E00、OracleSpatial、ESRI ArcSDE和MapInfo的MIF数据等API函数。

(3)基于公共接口的地理信息系统互操作模式。包括基于SQL、COM和CORBA的公共数据访问接口的API函数,基于网络服务的地理信息共享和互操作。

而空间信息处理功能的共享与互操作采用基于公共接口的地理信息系统互操作模式,例如OGC的网络处理服务规范WPS。

实现地理信息互操作,关键在于不同的系统和功能组件通过规范的接口来访问数据和调用数据处理操作。而开放式地理信息系统的理论研究成果,更多地表现为地理信息互操作规范。目前,广泛采用的地理信息互操作规范是由OGC制定的接口规范和国际地理信息标准化组织ISO/TC211制定的有关标准。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈