首页 理论教育 数字油藏中数据挖掘的特点

数字油藏中数据挖掘的特点

时间:2022-02-14 理论教育 版权反馈
【摘要】:数字油藏数据不是单一性质的数据集合,而是属于具有多种来源复杂的数据集合。由于地质系统及地质作用的复杂性,各种技术、方法、手段之间的较大差异等,数字油藏数据除常见空间数据本身的特点外,还有自身的一些特点,主要包括以下5点。由于数字油藏数据的特殊性,使用时不但要注意各种类型数据的适用性,而且对不同的研究目的需要根据不同的地质条件选用不同的数据,才能达到更好的应用效果,还应加强数据的加工、处理技术。

由于空间数据的复杂性,空间数据挖掘不同于一般的事务数据挖掘,它有如下一些特点。

(1)数据源十分丰富,数据量非常庞大,数据类型多,存取方法复杂。

(2)应用领域十分广泛,只要与空间位置相关的数据,都可对其进行挖掘。

(3)挖掘方法和算法非常多,而且大多数算法比较复杂,难度大。

(4)知识的表达方式多样,对知识的理解和评价依赖于人对客观世界的认知程度。

(5)空间数据挖掘的知识很多,但挖掘的程度和效益如何等这些问题目前还没有进行研究,实际上是空间数据挖掘质量评价的问题,只有解决了这个问题,才能开发出更好的空间数据挖掘系统和探索出更加完善的空间数据挖掘方法和算法。

(6)空间数据含有随机不确定性和模糊性,但目前的空间数据挖掘方法对空间数据的不确定性处理还存在一些问题。有的方法就没有考虑空间数据的不确定性;有的方法考虑了随机不确定性;有的方法考虑空间数据的模糊性。还没有一种方法能较好地既考虑空间数据随机不确定性,又考虑空间数据模糊性。

(7)空间数据挖掘的性能包括数据挖掘算法的有效性、可伸缩性和并行处理能力。空间数据挖掘算法的效率和可伸缩性是指为了有效地从空间数据库中的大量数据中抽取有用的知识,知识发现算法是有效的和可伸缩的。也就是说,一个空间数据挖掘算法在大型空间数据库中的运行时间必须是可预计的和接受的。许多现有的空间数据挖掘算法往往适合于常驻内存的、小数据集的空间数据挖掘,而大型空间数据库中存放了TB级的数据,所有的空间数据无法同时导入内存,所以从空间数据库的观点来看,有效性和可伸缩性是实现空间数据挖掘系统的关键问题。

数字油藏数据不是单一性质的数据集合,而是属于具有多种来源复杂的数据集合。由于地质系统及地质作用的复杂性,各种技术、方法、手段之间的较大差异等,数字油藏数据除常见空间数据本身的特点外,还有自身的一些特点,主要包括以下5点。

(1)数据以定性数据和定量数据为基础类型。尤其是定性数据,常常表现为地质描述,对定性数据的挖掘方法研究尚未成熟,依赖于地质研究人员的地质知识素养。

(2)数据常常具有混合分布特征,它反映了多种地质因素的综合作用,如有些油藏具有多个物源供给形成。

(3)一种数据可反映储层的多种性质,如地震资料中的振幅信息既包含储层本身的特性,又有储层中所存储的油气特性。

(4)数据分布不均匀、量纲变化大、尺度不统一。如地震资料在平面上的覆盖区域远远大于井的抽样范围,而纵向分辨率只能反映砂层组的有关信息,远远低于井资料的纵向分辨率。

(5)数据抽样的不可逆性和人为性。数据抽样的不可逆性也就是数据不能重复抽样,如在某个位置钻井后是不可能在同一个地方再进行钻井;数据抽样的人为性是指在抽样时是按照一定规则进行抽样,如在油田勘探开发中,往往构造高部位的井多,而构造低部位的井少,这往往使获得的知识过高地估计了地下的实际情况。

由于数字油藏数据的特殊性,使用时不但要注意各种类型数据的适用性,而且对不同的研究目的需要根据不同的地质条件选用不同的数据,才能达到更好的应用效果,还应加强数据的加工、处理技术。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈