首页 百科知识 空间数据库设计

空间数据库设计

时间:2022-10-09 百科知识 版权反馈
【摘要】:空间数据库设计是指在数据库管理系统的基础上建立空间数据库的过程。在此,空间数据库设计主要包括概念设计、逻辑设计、物理设计三部分。这样做可以使数据库设计各阶段的任务相对单一化,设计复杂程度降低,便于组织管理,且不依赖于具体的硬件环境和DBMS,更容易为用户所理解,因而能准确反映用户的信息需求。由于DBMS目前一般采用关系数据模型,因此数据库的逻辑设计,就是将概念设计中所得到的E-R图转换成等价的关系模式。

7.3.3 空间数据库设计

空间数据库设计是指在数据库管理系统的基础上建立空间数据库的过程。数据库设计要完成空间实体的抽象过程,并且抽象后的空间数据模型越能反映现实世界,在其基础上生成的应用系统就越能更好地满足用户对数据处理的要求。在此,空间数据库设计主要包括概念设计、逻辑设计、物理设计三部分。

1.概念设计

从现实世界到计算机系统,人们首先要做的是概念模型的建立。概念模型反映了人们对现实世界的认知与理解,是从现实世界到人们大脑世界的映射,对后期GIS的建设起着先导性的作用。

GIS作为一种信息系统,其以现实世界为研究目标,以计算机内部的二进制数字世界作为存储载体。现实世界极其复杂,把现实世界中的事物直接转换为机器中的对象非常不方便。因此,人们研究把现实世界中的事物抽象为不依赖具体机器又接近人们的思维的方法。于是,在需求分析和逻辑设计之间增加概念设计阶段,对需求分析阶段收集的数据进行分析、整理,确定地理实体、属性及其关系,产生一个反映用户观点的概念模式。这样做可以使数据库设计各阶段的任务相对单一化,设计复杂程度降低,便于组织管理,且不依赖于具体的硬件环境和DBMS,更容易为用户所理解,因而能准确反映用户的信息需求。

由于职业、专业等的不同,人们所关心的问题、研究对象、期望的结果等方面存在着差异,因而对现实世界的描述和抽象也是不同的,形成了不同的用户视图,并将各用户的局部视图合并成一个总的全局视图,形成独立于计算机的反映用户观点的概念模式。概念数据模型的内容包括重要的实体及实体之间的关系,在此,可使用概念模型描述工具E-R模型,即实体-联系模型,包括实体、联系和属性三个基本成分,它比一般模型能更好地模拟现实世界,具有直观、自然、语义较丰富的特点。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,并且独立于计算机存储,因而比逻辑设计得到的模式更为稳定,在地理数据库设计中得到了广泛应用。近几年来,E-R模型得到了扩充,增加了子类的概念,即增加了语义表达能力,使之能更好地模拟现实地理世界。

例如在城市道路数据库系统设计中,我们将城市道路组成要素抽象为道路、道路边线、路段、街区、结点等实体,然后明确实体属性,如道路等级、道路名称等属性,以及路段的走向、路面质量、宽度、等级等属性,再明确实体间的相互关系(如图7-5所示)。在初步E-R图中,可能存在一些冗余的数据和实体间冗余的联系,一般情况下,冗余的数据和冗余联系容易破坏数据库的完整性,为数据库的维护增加困难,应当予以消除。

2.逻辑设计

逻辑设计是在概念设计的基础上,按照不同的转换规则将概念模型转换为具体DBMS支持的数据模型的过程,包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。概念设计是对客观世界的描述,与实现无关,而逻辑设计依赖于实现的DBMS,从数据库逻辑设计导出的数据库结构应是DBMS能接受的数据库结构。由于DBMS目前一般采用关系数据模型,因此数据库的逻辑设计,就是将概念设计中所得到的E-R图转换成等价的关系模式。逻辑结构设计的任务就是把概念结构设计阶段设计好的基本E-R图转换为与选用的DBMS产品所支持的数据模型相符合的逻辑结构。具体的转换过程分为如下两类:一类是实体和实体属性的转换,一个实体对应一个关系模式,实体的属性对应关系的属性,实体的码对应关系模式的候选码;另一类是实体之间的联系和联系属性的转换。

img137

图7-5 空间数据模型概念设计

逻辑数据模型的内容包括所有的实体和关系,需要确定每个实体的属性,定义每个实体的主键,指定实体的外键,需要进行范式化处理。逻辑数据模型的目标是尽可能详细地描述数据,但并不考虑数据在物理上如何实现。逻辑数据建模不仅会影响数据库设计的方向,还间接影响最终数据库的性能和管理。如果在实现逻辑数据模型时投入得足够多,那么在物理数据模型设计时就可以有许多可供选择的方法,逻辑数据模型反映的是系统分析设计人员对数据存储的观点,是对概念数据模型进一步的分解和细化。而导出的逻辑结构是否与概念模式一致,能否满足用户要求,还需要对其予以优化,在有些数据模型的设计过程中,概念数据模型和逻辑数据模型是合在一起进行设计的。

由于各种DBMS产品一般都有许多限制,提供不同的环境与工具,因此,逻辑设计首先将概念模型向一般关系、网状和层次模型转化,然后依据应用的需求和具体的DBMS的特征进行调整和完善,即数据库逻辑设计的结果不是唯一的。数据模型的调整通常包括两个方面:根据数据字典中对信息查询响应时间的要求和查询频率要求,适当调整数据结构,例如可增加必要的冗余数据,另外可把经常进行查询连接的两个关系合并为一个关系,这些调整需要仔细考虑后再进行修改。

3.物理设计

为一个给定的逻辑数据模型选取一个最适合应用要求的物理结构的过程,就是数据库的物理设计。物理设计是指数据库存储结构和存储路径的设计,主要内容包括确定记录存储格式,选择文件存储结构,确定所有的表和列,定义外键用于确定表之间的关系,决定存取路径,分配存储空间,即逻辑设计在计算机的存储设备上实现。物理设计依赖于给定的计算机系统和DBMS,一个好的物理存储结构必须满足两个条件:一是地理数据占有较小的存储空间;二是对数据库的操作具有尽可能高的处理速度。

数据的物理表示分两类:数值数据和字符数据。数值数据可用十进制或二进制形式表示。通常二进制形式所占用的存储空间较少。字符数据可以用字符串的方式表示,有时也可利用代码值的存储代替字符串的存储。数据库的物理设计通常分为两步:首先确定数据库的物理结构,在关系数据库中主要指存取方法和存储结构;其次在数据库物理设计过程中,需要对时间效率、空间效率、维护代价和各种用户要求进行权衡,其结果可以产生多种方案,数据库设计人员必须对这些方案进行细致的评价,从中选择一个较优的方案作为数据库的物理结构。如果该结构不符合用户需求,则需要修改设计。应注意的是,数据库中运行的事务会不断变化、增加或减少,以后需要根据上述设计信息的变化调整数据库的物理结构。不同的DBMS所提供的物理环境、存取方法和存储结构有很大差别,提供给设计人员使用的设计选择范围也不相同,因此没有通用的物理设计方法可遵循,只能给出一般的设计内容和原则,希望设计的物理数据库结构各种事务响应时间少、存储空间利用率高、事务吞吐率大。

物理设计中还包括数据字典的确定,数据字典是关于数据描述信息的名词数据库,用于描述数据库的整体结构、数据内容和定义等,它包含每一数据元的名字、意义、描述、来源、功用、格式以及与其他数据的关系,是数据库的元数据。

4.数据层设计

数据层是GIS中的一个重要概念,大多数GIS都将数据按逻辑类型分成不同的数据层进行组织。GIS的数据可以按照空间数据的逻辑关系或专业属性分为各种逻辑数据层或专业数据层,例如,地形图数据可分为地貌、水系、道路、植被、控制点、居民地等数据层分别存储,将各层叠加起来就合成了地形图的数据,在进行空间分析、数据处理、图形显示时,往往只需要若干相应图层的数据。

良好的数据分层可使数据的含义明确可辨,减少内外数据交换量,并获得理想的显示效果,一般情况下,空间数据分层主要包括以下几种方式。

(1)按空间数据所涉及的主题内容进行分层

即垂直方向的设计,不同类型的数据由于其应用功能相同,在分析和应用时往往会同时用到,因此在设计时应反映出这样的需求,即可将这些数据作为一层。例如,多边形的湖泊、水库,线状的河流、沟渠,点状的井、泉等,在GIS的运用中往往同时用到,因此,可作为一个数据层。同时考虑建立分类编码标准,以便区分空间要素的类型,并设计主题空间要素的属性表。

(2)按空间要素实体类型分层

地理要素在空间形态上可分为点、线、面三种要素,设计图层时一般将点、线、面实体分别放在不同图层上。如虽然都属于城市道路交通要素,但是面状的交通站场设施和线状的道路交通线路就可考虑分别存储,反而有利于系统操作。

(3)根据用户业务要求分层

不同部门或用户所需要的操作信息或信息处理过程不同,即使同一类型数据,业务处理过程不同,结果也可能不同,根据用户的使用目的把各专业要素分开,反而有利于信息的提取和处理。

数据层的设计一般是按照数据的专业内容和类型进行划分的,通常,数据的专业内容是数据分层的主要依据,同时也要考虑数据之间的关系,如考虑道路与行政边界重合、河流与地块边界重合等,这些数据间的关系在数据分层设计时应体现出来。

由于空间数据范围的限制,对于大面积、大区域空间数据,还要考虑数据的分幅,即将图形对象划分为多个不同位置范围的数据集合。在此,图形数据分幅主要包括两种方法:一种是等间隔分幅法,如地形图的分幅,另一种是区域分幅法,如以行政区域分幅,当用户只对某区域内的图形感兴趣时,就可以“滤掉”其他区域的数据了。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈