首页 理论教育 数字油藏中数据挖掘应注意的问题

数字油藏中数据挖掘应注意的问题

时间:2022-02-14 理论教育 版权反馈
【摘要】:数据挖掘与知识发现成功的关键必须做到以下几点。这一点是能否挖掘出有用知识的基点,不能说给你一些数据,数据挖掘就能挖掘出知识来。在给出足够的数据之后,采用什么样的挖掘方法,以何种方式挖掘,必须在有明确目标的情况下进行,盲目地采用数据挖掘只会使获得的知识一无是处。缺失值数据处理。从目标明确到挖掘知识的评价与判断都需要储层地质专家的指导,否则知识的可信度和可靠性都值得怀疑。

数据挖掘与知识发现不是给一些数据,采用一些数据挖掘算法就可以轻易地挖掘出知识。数据挖掘与知识发现成功的关键必须做到以下几点。

(1)要有明确的目标:用数据挖掘方法要解决什么问题,挖掘什么样的模式、规律或知识,必须提出要挖掘的目标。这一点是能否挖掘出有用知识的基点,不能说给你一些数据,数据挖掘就能挖掘出知识来。在给出足够的数据之后,采用什么样的挖掘方法,以何种方式挖掘,必须在有明确目标的情况下进行,盲目地采用数据挖掘只会使获得的知识一无是处。

(2)足够和相对准确的数据。数据是知识发现的基础,数据的质量和数量对知识发现起决定性作用,不是随便给一些数据就能挖掘出有用的知识,数据必须有一定的质量和数量,在极不完整的数据上进行数据挖掘不会得到好的结果,往往数据质量和数量比数据挖掘方法更重要。

(3)缺失值数据处理。空间数据缺值研究的过程主要可以分为两步:首先利用各种统计手段模拟出缺失值,然后再利用包含已知观测值和缺失值的全集进行统计分布函数参数估计。产生缺失值的方法包括均值转嫁、有补充的随机替代、无补充的随机替代、时间序列转换、完全均值转换等,这些方法将缺值的补充与分布函数的参数估计作为两个独立部分看待。而最大值期望算法则将二者有机联系起来,在处理非完整数据集时对其最大似然函数应用了迭代方法,从而在模拟缺失样本的同时估计出分布函数的未知参数。此外,Kumar JK提出在空间信息不完整的情况下,采用模糊神经网络对空间分布进行预测。

(4)储层地质专家的参与和指导。从目标明确到挖掘知识的评价与判断都需要储层地质专家的指导,否则知识的可信度和可靠性都值得怀疑。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈