首页 理论教育 数字油藏中数据挖掘对象的类型

数字油藏中数据挖掘对象的类型

时间:2022-02-14 理论教育 版权反馈
【摘要】:在数据管理中对数字油藏数据特点的分析表明,数字油藏的挖掘对象是大量的、不完全的、有噪声的、模糊的、随机的与储层相关的数据。观测数据是指利用各种观测手段对研究对象进行观测或度量所获得的数据。是数字油藏研究的基础数据。定性数据包括定义型数据和有序型数据两类。例如油气地层的分层数据就是典型的间隔型数据。在数字油藏中,经常会使用一些经验数据,如地质统计学参数等。

数据管理中对数字油藏数据特点的分析表明,数字油藏的挖掘对象是大量的、不完全的、有噪声的、模糊的、随机的与储层相关的数据。一般可分为观测数据、综合数据和经验数据三大类型(表5-1)。

表5-1 数字油藏的数据分类

1.观测数据

观测数据是指利用各种观测手段对研究对象进行观测或度量所获得的数据。是数字油藏研究的基础数据。观测数据一般未经过任何加工处理,所以也称之为原始数据。观测数据又可分为定性与定量两大类。

1)定性数据

定性数据是指不能用数值描述,只能用符号或代码描述的观测数据。这种数据不具备数量上的概念。定性数据包括定义型数据和有序型数据两类。

(1)定义型数据。定义型数据除没有数量上的概念,并且数据之间没有次序关系。一般用符号或代码形式表示。定义型数据通过区分不同对象或个体并赋予不同的代码后形成的。如描述不同沉积环境的沉积相。定义型数据之间只存在同类或不同类的关系,如两个研究区都属于河流相。

(2)有序型数据。顾名思义,有序型数据之间存在一种单调的升降关系,常可以用等级符号或代码形式来表示。有序型数据与定义型数据的差别就在于数据之间有无次序,如储层评价中储层的分类。有序型数据之间除了相等和不相等关系之外,还有“大于”或“小于”关系,如渗透率共分为五级,从特高、高、中、低到特低。

2)定量数据

定量数据是指能用数值大小来描述的观测数据。包括间隔型数据和比例型数据两类。

(1)间隔型数据。是指有明确的数量概念,可以用数值形式表示的观测数据,数据之间以跳跃的方式出现。例如油气地层的分层数据就是典型的间隔型数据。间隔型数据之间除了具有相等、不相等和大于、小于关系外,还可定量说明数据之间的差异,且这种差异具有实际意义,如地层分层不仅说明了地层之间的界线,还说明了地层沉积可能的先后顺序。

(2)连续型数据。连续型数据也有明确的数量概念,其值在空间中的分布连续没有间断。这种类型的数据特别得多,如测井资料、地震资料等,其操作关系也要比其他类型的数据多,可以采用许多数学方法加工处理。

2.综合数据

综合数据是由经过定量化处理后的定性数据或定量数据,经有限次运算后得到的具有明确地质意义的概括性数据,如随机变量的各种统计特征,如平均值、标准差、极差、相关系数等。也可看作初步知识,主要用于对综合变量进行赋值

3.经验数据

经验数据是指在大量研究了地质现象和规律后,经过归纳总结或根据经验公式计算而得到的经验值,通常是大量地质信息的综合反映。有时经验数据的地质意义往往是十分明确的,但是它们到底受到哪些地质因素的影响、以什么方式影响,以及它们和一些地质因素之间的作用关系往往是不明确的。在数字油藏中,经常会使用一些经验数据,如地质统计学参数等。经验数据常常是对某一地区地质条件下大量数据统计的结果,具有明显的区域性特征。因此,运用经验数据时要特别注意地质条件是否一致,不加选择地引用会导致错误的结果。经验数据也可看作经验知识。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈