首页 百科知识 分布式土地管理数据中心

分布式土地管理数据中心

时间:2022-11-11 百科知识 版权反馈
【摘要】:数据具有物理的分布性,而这些数据逻辑上却是一个整体,它们被分布式土地管理数据中心的所有用户共享,并由数据库管理系统统一管理。在分布式土地管理数据中心中,通过数据冗余可以提高系统的可靠性和可行性,并改善系统的性能。所有站点构成一个逻辑整体,统一在分布式土地管理数据中心管理系统的管理下,共同参与并完成全局应用。因此,分布式土地管理数据中心的数据存储、管理的逻辑结构如图6-10所示。

6.2.2 分布式土地管理数据中心

由于土地管理数据本质上是分散分布的,土地管理用户也是分布各处的,分布的用户需要对分布的地理信息完成浏览、查询、分析、更新等操作,也就是说,土地管理数据的来源和应用是分布的。

目前,土地管理大多以统一完整的空间数据库对空间数据进行集中式的存储和管理。即先将在不同区域上采集的数据集中起来放在一个数据库中管理和维护,再将这些数据发布出去,从而实现了一个“分布—集中—分布”的管理过程。然而随着国土资源电子政务建设的推进,这种集中的管理模式渐渐显示出其不足之处:由于数据是集中存放在一个数据库中的,网络上的各个节点只能通过访问这个数据库才能共享数据。这种管理模式与数据特性之间的矛盾严重影响了空间数据管理的性能和效率。

建立分布式土地管理数据中心,按土地管理数据的来源及需求,分散建立多个土地管理数据库,以代替一个集中式数据库,大部分地理数据可以就地存取,同时又可共享一些偶尔需要的其他数据库的数据,这显然要比建立一个集中式数据库合理。分布式数据库技术就可以很好地解决以上问题。

与传统的集中式数据库不同,分布式数据库是计算机网络环境中各场地(Site)或节点(Node)上数据库的逻辑集合。它是一组结构化的数据集合,逻辑上属于同一系统,而物理上分布在计算机网络的不同节点上,具有分布性和逻辑协调性的特点。

1.分布式土地管理数据中心的特点

分布式土地管理数据中心是由若干个站点(或节点)集合而成的,它们通过网络连接在一起,每个站点都是一个独立空间数据库系统,它们都拥有各自的数据库和相应的管理系统及其分析工具。整个数据库在物理上存储于不同的设备上,而在逻辑上是一个统一的空间数据库。

由此可以总结出分布式土地管理数据中心的特点:

(1)物理分布,逻辑统一。数据具有物理的分布性,而这些数据逻辑上却是一个整体,它们被分布式土地管理数据中心的所有用户共享,并由数据库管理系统统一管理。

(2)数据独立性。在分布式土地管理数据中心中,数据独立性除了具有数据的逻辑独立性和数据的物理独立性外,还有数据分布独立性,亦称分布透明性(Distribution Transparency)。

(3)适当的数据冗余。在分布式土地管理数据中心中,通过数据冗余可以提高系统的可靠性和可行性,并改善系统的性能。

2.分布式土地管理数据中心的逻辑结构

分布式土地管理数据中心中的数据是物理分布在用计算机网络联结起来的各个站点,每一个站点是一个集中式数据库系统,都有自治处理能力,完成本站点的局部应用。所有站点构成一个逻辑整体,统一在分布式土地管理数据中心管理系统的管理下,共同参与并完成全局应用。因此,分布式土地管理数据中心的数据存储、管理的逻辑结构如图6-10所示。

img99

图6-10 分布式土地管理数据中心管理系统示意图

图6-10中:SDB为土地管理数据存储节点,该节点负责集中存储部分土地管理数据,如图6-11所示。任何用户在任一时刻都可访问数据中心,通过数据中心进行空间数据的交换、使用和共享。其优点是数据集中,保证了土地管理数据的实时性,但其缺点也是显而易见的,即其访问效率受并发用户的数量和网络状况的制约。

img100

图6-11 数据中心策略图

DDBMS为分布式数据库管理系统,负责数据库的定义、建立、索引、更新以及维护的一个软件系统:分布式数据库管理系统为所有用户提供了一个统一存取空间数据的环境,主要完成数据源的路径查找、浏览、编辑、存储等操作。当用户进行数据操作时,首先根据定义好的数据管理策略判断数据源的位置是本地还是外地,获取数据源路径,然后使用DDBMS提供的数据管理工具完成相应的数据操作,对用户屏蔽了多个数据源的差异,使得用户像使用一个空间数据库系统一样使用多空间数据库管理系统(见图6-12)。

img101

图6-12 分布式多空间数据库管理系统结构图

客户端包括用户、用户进程、用户请求和用户模式。用户指与处理系统交往的对象,就是指那些分布式数据库管理系统的使用者,它由一个或多个用户进程所表示;用户进程是用户的代理,它指的是一个过程,就是与特定用户相关的一个程序的一次执行事例;用户请求指的是用户进程发出并由DBMS接收和处理的一个报文,这个用户请求必须由特定的执行所产生。

Internet/Intranet。和集中式数据库中的单个处理设施相比较,分布式数据库中需要研究的硬件设备更加复杂,除了分散的单个硬件设备以外,它还包含与网络有关的部分,包括网络数据库管理系统(Network DataBase Management System,NDBMS)、网络数据目录(Network Data Directory)、网络存取进程(Network Access Process)和网络描述(Network Description)等。

3.土地管理数据分片

由于分布式土地管理数据库并不是存储在一个节点的计算机存储设备上,而是按照某种逻辑划分分散在各个相关的场地上。因此,需要在不同节点的计算机存储设备上存储数据时,就需要对数据进行必要的逻辑划分,这种按照数据组织策略将空间数据存储在各个相关的节点上的数据组织方式即为数据分片。

(1)土地管理数据分片

根据土地管理数据的区域性和专题性特征,可以将空间数据分片划分为区域分片(也称地理分片、空间分片)和专题分片(也称图层分片);根据分布式空间数据库系统的异构性,也可以将土地管理数据分片划分为异构分片和同构分片。

区域分片是按土地管理数据水平方向进行的划分,这是由地理信息的区域性所决定的,在分布式土地管理数据库中,可以按照不同的行政区域范围对空间数据进行数据分片划分(如图6-13所示)。

img102

图6-13 区域分片示意图

专题分片是按土地管理数据垂直方向进行的划分,这是由土地管理业务专题性所决定的(如图6-14所示)。专题分片,通常是各不同部门所拥有的同一地理范围内的专业数据,如地籍数据、土地利用数据、土地规划数据、土地整理开发复垦数据、建设用地数据等。它们可能分布在不同的场地上,并为相关的职能部门所拥有和管理。

img103

图6-14 专题分片示意图

异构分片是指分片的异构性,这是由于不同的部门采用了不同的GIS系统对空间数据进行组织和管理所引起的。同构分片是指分片的同构性,同一种GIS系统产生的数据分片就是同构分片。而不同的GIS系统产生的数据分片就是异构分片。

(2)土地管理数据的分片冲突

同构条件下的分片冲突,主要表现在水平分片和垂直分片空间数据不一致上,具体表现为:

①几何不一致的现象出现在垂直方向上的专题分片中,指的是由于测量或数字化误差,使得组成全局地图的垂直分片间发生几何位置上的偏差,如同时作为河流和境界的要素在不同专题图层中几何位置之间的不一致。

②边界不一致的现象出现在水平方向上的区域分片中。若干个区域分片重构生成一个全局图层,在相邻分片的边界部分,由于数字化误差等原因,同一地理要素的线段或弧段的几何数据不能够相互衔接。

③地理数据可以有不同的表达方式,如矢量、栅格、不规则三角网、等值线等。根据应用的需求,对于同一种地理现象,不同部门采用了不同的表达方式。在全局应用时,就会出现水平分片表达不一致的现象。

④不同的研究领域,人们研究的角度不同,解决问题的侧重点不同,这就导致了语义的不同。举例来说,同一片森林地区,地理学家关心的是土壤、水文状况,植物学家关心的是植被生长情况。因此,对于同一个地理要素,在现实世界中其几何特征是一致的,但是却对应着不同语义。同时,即使是解决相同的问题,由于分布的数据缺乏规范和标准,也会存在语义上的差别。这些都会导致在全局应用中,水平分片出现语义不一致的现象。

⑤如果全局图层是由不止一个水平分片重构而生成的,那么就要求所有的水平分片具有相同的投影方式和比例尺。同样,地图是图层的集合,也要求所有相关垂直分片具有相同的投影方式和比例尺。但是,往往不同来源的数据分片存在着投影和比例尺的不一致。

异构条件下的分片冲突。异构的数据的分片冲突主要表现在以下三个方面:

①数据模型和数据结构。GIS系统间存在数据模型和数据结构的差异,分布式空间数据库系统通过将所有参与空间数据库的数据模型映射到一个全局统一的数据模型上来屏蔽掉这种异构性。

②访问方式。空间查询语言是用户获取空间数据的方式,但是在GIS领域中由于缺乏一个标准的空间查询语言,不同的空间数据库采用了不同的数据库语言。

③数据格式。严格地说,数据格式是GIS的物理存储方式,分布式系统不应该直接作用于物理文件,而是采用互操作的方式。但是在实际中,很多的GIS系统采用的还是文件存储方式,分布式空间数据库系统必须能够集成这样的数据源。

4.分布式空间数据库的访问

分布式空间数据库是由物理上分散在计算机网络的各个节点上的多个空间数据库组成的,而逻辑上有机地结合为一个虚拟的整体空间数据库。因此,用户对分布式空间数据库的访问主要表现在两个方面:首先,用户对虚拟的整体空间数据库进行访问,其将用户的访问翻译成对一个或多个具体的局部数据库的访问;其次,用户根据翻译后的访问,对具体的局部数据库进行数据的访问操作,虚拟的整体空间数据库需要将操作结果返回给最终用户。土地管理数据中心的访问方式主要分为以下三种:

(1)模式结构

分布式空间数据库系统的模式结构如图6-15所示。总体上可以分为两部分:下面部分是具体的局部空间数据库的模式,代表了各场地上参与空间数据库系统的基本结构;上面部分是分布式空间数据库系统增加的模式,代表了整体的虚拟空间数据库系统的基本结构。

图6-15中:

①全局用户视图。由于业务职能的不同,全局用户所关心的问题、处理的数据、期望的结果等都存在着差异,因而形成了不同的全局用户视图。

img104

图6-15 分布式空间数据库管理系统的模式结构图

②全局概念模式。以全局统一的空间数据模型定义了分布式空间数据库提供给全局用户共享的全部数据的逻辑结构,即所有全局图层的定义。

③空间元数据库。空间元数据库主要存储的是关于各参与空间数据库的信息,包括各参与空间数据库的数据模型信息、数据结构信息、数据范围信息以及参与数据库节点的定位信息、网络描述等信息,即有关空间数据分片信息和分片后空间数据元数据信息的数据库。

④分片模式。每一个全局图层可以分为若干个不相交的分片,分片模式就是所有分片定义的集合。由于分片在物理上是分布的,因此,分片模式就必须详细描述分片的物理分布信息;同时,由于空间数据分片存在着各种分片冲突,因此,在从分片模式映射到全局概念模式时,必须解决分片冲突引起的问题。

⑤局部概念模式。局部概念模式定义了参与空间数据库全体数据的逻辑结构。它是全局概念模式的子集,是由局部空间数据模型定义的。如果局部空间数据模型和全局空间数据模型不相同(即分片是异构的),也就是说,将异构空间数据集成到分布式空间数据库系统时,需要将局部数据模型映射到全局数据模型,即异构同化。

通过从集中式系统的局部概念模式到分布式全局系统的分片模式、全局概念模式,最后到全局的用户视图,分布式空间数据库系统实现了分布透明性,包括分片透明性、位置透明性和局部数据模型的透明性,以及局部空间查询语言的透明性。

正是因为实现了分布的透明性,所以全局用户可以使用单一的空间数据模型和单一的空间查询语言,操作逻辑上统一、物理上分布的异构的分布式空间数据库。

(2)空间元数据库

空间元数据库是关于网络数据目录和空间元数据信息的数据库。其中网络数据目录描述的是各个土地管理数据分片的范围、数据模型、数据结构以及所在的位置和该节点的网络数据描述,通过它用户可以获取具体的空间数据放在什么地方(即哪一个参与的局部数据库)、如何与其建立连接(如通过该参与空间数据库节点的IP地址或计算机名)以及怎样对其进行访问(这里面需要涉及的问题有该局部空间数据库的数据模型、数据结构等内容);空间元数据信息是指具体的空间数据的元数据信息。

元数据(Metadata)是“关于数据的数据”或“关于信息的信息”,它被列为数字地球技术系统的六大核心技术之一,用于描述地理数据集的内容、质量、表示方式、空间参照系、管理方式以及数据集的其他特征。空间元数据主要有以下几个方面的作用:

①帮助数据生产者有效地组织、管理和维护空间数据,建立数据文档,并保证即使其主要工作人员离开岗位时,也不会失去对数据情况的了解。

②帮助用户查询所需的空间信息。通过数据生产者在数据存储、数据分类、数据内容、数据质量、数据交换中心及数据销售等方面的信息,方便用户得到可靠的数据保证。用户可以方便查询、检索到所需的地理空间数据。同时,当使用数据引起矛盾时,数据生产者和用户都可以利用空间元数据维护其利益。

③用来建立空间信息的数据目录和数据交换中心。通常由一个组织产生的数据可能对其他组织也有用,而通过数据目录、数据代理机、数据交换中心等提供的空间元数据内容,用户便可以很容易地使用它们,达到空间信息的共享。

④提供数据转换方面的信息。通过空间元数据,人们便可以接受并理解数据集,并可以与自己的空间信息集成在一起,进行不同方面的分析决策,使地理空间信息实现真正意义上的共享,发挥其最大的潜力。

对于空间元数据的内容体系,目前国际各大组织间仍存在一定的分歧。FGDC认为它是“关于数据内容、质量、条件以及其他特征的数据”,它把空间元数据分为标识信息、数据质量信息、空间数据组织信息、空间参照系信息、实体和属性信息、发行信息以及元数据参考信息等七个部分进行研究。CEN/TC287认为空间元数据是“描述地理数据集内容、表示、空间参考系、质量以及管理的数据”,它把数据集分为标识信息、数据集综述信息、数据集质量元素、空间参照系信息、范围信息、数据定义、分类信息、管理信息、空间元数据参考以及空间元数据语言等十个部分进行研究。ISO/TC211对于空间元数据的概念认识和FGDC相同,但在内容划分上仍有明显的差异,它把空间元数据分为标识信息、数据质量信息、数据集继承信息、空间数据表示信息、空间参照系信息、应用要素分类信息、发行信息以及空间元数据参考信息等八个部分进行研究。

(3)空间数据库的访问

由于现有商用数据库系统对空间数据操作的局限性,如不支持空间数据的复杂操作,将空间对象的数据结构预先进行了定义等,所以在使用上仍然受到一定的限制。

img105

图6-16 SDE体系结构示意图

空间数据库引擎(Spatial Database Engine,SDE)技术就是在这样的条件和环境下应运而生的。其概念是由ESRI公司提出的,从空间数据管理的角度来看,SDE可看成是一个连续的空间数据模型,借助这一模型,可将空间数据加入到关系型数据库管理系统(RDBMS)中去。一般而言,SDE只提供存储、读取、检索、管理数据和对数据的基本处理等功能,不负责进行空间分析和复杂处理。ESRI公司的SDE体系结构如图6-16所示,相对于客户端来讲,SDE是服务器,提供空间数据服务的接口,接收所有空间数据服务请求;相对于数据库服务器来讲,SDE则是客户机,提供数据库访问接口,用于连接数据库和存取空间信息。

各大数据库软件商在其产品中加入了对空间数据的支持,如Oracle公司推出的SDO,它采用了HHCode技术来存储欧氏空间维度和附加维度数据,并为空间数据的存储和索引定义了一套数据库结构,通过扩展Oracle PL/SQL为空间数据的处理和操纵提供了一系列函数和过程,从而实现对空间数据服务的支持;地理信息系统软件商,如ESRI公司的ArcSDE,提供专用的API用于将空间数据加入到RDBMS中,并支持对这些数据的访问、国内的超图公司推出的SuperMap SDX等。

img106

图6-17 分布式环境下SDE的操作流程图

分布式环境下SDE的研究还刚刚开始,在分布式环境下,SDE的功能不仅仅局限于对空间数据的存储、读取、检索、管理和对数据的基本处理上,除了传统的SDE应该具有的功能外,分布式系统下SDE还应该具有数据定位和数据通信的功能,其操作流程如图6-17所示。首先是客户应用程序向SDE Client发出数据请求,SDE Client再向SDE Server转达这种请求,当SDE Server收到这个数据请求时,它首先向全局的逻辑数据库(即元数据库)查询所需空间数据的访问信息(如空间数据所在的位置和访问方式),当收到这些信息后,SDE Server再进一步向局部空间数据库查询具体所需的空间数据,并将返回的结果进行综合和整理,再发给SDE Client,最终将结果返回到客户应用程序。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈