首页 百科知识 信息提取的基本方法

信息提取的基本方法

时间:2022-11-02 百科知识 版权反馈
【摘要】:矿化蚀变信息是找矿的重要标志,考虑到蚀变信息的提取对遥感数据波段设置的要求,本项目工作区内蚀变信息提取将主要采用ETM+数据进行。目前,蚀变信息提取的方法有很多,如比值分析、主成分分析、彩色空间变换、光谱角等。在植被分布较少的基岩裸露地区,比值分析技术可增强热液蚀变典型矿物的光谱响应。故在选择遥感异常提取方法时,不得不将比值法的结果作为参考。

矿化蚀变信息是找矿的重要标志,考虑到蚀变信息的提取对遥感数据波段设置的要求,本项目工作区内蚀变信息提取将主要采用ETM+数据进行。目前,蚀变信息提取的方法有很多,如比值分析、主成分分析(克罗斯塔)、彩色空间变换、光谱角等。

一、波段比值法

比值法,或叫比值增强,是增强不同岩石、土壤之间的差别,研究地物类型及分布的最简便、最常用的方法。在植被分布较少的基岩裸露地区,比值分析技术可增强热液蚀变典型矿物的光谱响应。

波段比值法是根据代数运算的原理,当波段间差值相近但斜率不同时,利用反射波段与吸收波段的比值处理增强各种岩性之间的波谱差异,抑制地形的影响,并显示出动态的范围。因而,以矿物的特征光谱为基础,选用适当的波段比值进行彩色合成,可增强弱信息。

对于蚀变矿物就是分析蚀变矿物的波谱曲线,找出斜率变化最大的区间和曲线中的反射峰与吸收谷,确定波谱范围,做比值增强处理,形成突出蚀变信息的图像。

根据野外光谱测量,理论上能被ETM+图像资料识别的蚀变矿物有3类: ①铁的氧化物,氢氧化物和硫酸盐,包括铁矿,赤铁矿,针铁矿和黄钾铁矾,这类矿物在TM1、2、3波段,光谱反射率曲线上升梯度较大,而在TM4波段附近有一个较强的光谱吸收带。②羟基类矿物,包括黏土矿物和云母,其反射光谱的典型特征表现在TM7波段存在有较强的光谱吸收。③水合硫酸盐矿物(石膏和明矾石)和硫酸盐矿物(方解石白云石)在TM7波段,均有较强的光谱吸收,而前者TM4大于TM5,后者TM4与TM5相近。

识别热液蚀变常用的波段比值有: TM3/TM1,用于识别褐铁矿;TM5/TM4,用于区分有植被和无植被覆盖的土壤及岩石;区分云母及黄钾铁矾,明矾石及石膏、方解石及黏土这3类矿物;识别褐铁矿化;TM5/TM7,识别含羟基矿物,水合硫酸盐和碳酸盐;TM7/TM4,区分云母、石膏与明矾石;TM3/TM4,识别植被和区分褐铁矿化岩石。例如: 以TM5/TM7(红)、TM3/TM1 (绿)、TM3/TM4(蓝) 3种波段比值图像,进行假彩色合成,赤铁矿和针铁矿呈绿至青色,黄钾铁矾呈黄白色,含羟基矿物、水合硫酸盐化岩石呈品红色(表4-2)。

表4-2 ETM+数据常用波段比值处理

由图4-2(a)可以看出,利用比值法进行异常提取,无论高、低值区均可有同样的比值,因此,低值区异常不可避免,换言之,假异常不可避免。在利用比值法之前,应进行详细的去干扰工作。由图4-2(b)可以看出,差和比值法是一种非线性处理,对高值区压缩,对低值区拉伸,这对于提取高值区异常不利;(TM5-TM7)/(TM5+TM7)的实际值均在0~1/3之间,动态范围较小,也是不利因素。由图4-2(c)可以看出,数据先截取再做比值较先做比值后截取对于减少低值区异常更为有益。

图4-2 波段比值法评价图

[图(a)、(b)据丰茂森,1992;图(c)据张瑞丝,2009]

虽然经数据截取所做比值对低值区异常有所抑制,但并不能从根本上改变比值法的前两个弱点,实践表明:利用比值法提取地层信息,圈定蚀变带分布,在干旱—半干旱地区效果较为明显,但植被茂密地区则不理想。故在选择遥感异常提取方法时,不得不将比值法的结果作为参考。在与主成分分析法相结合的异常信息提取过程中,比值法被用来去除干扰,通过TM7/TM1的比值运算,选定相关的阈值可以用来去除水体及阴影的干扰,而TM3/TM4的比值用来去除植被信息的干扰。

二、主成分分析

主成分分析法,在数学上常称为K-L变换,是在统计特征基础上的多维(如多波段)正交线性变换。多波段图像通过这种变换后产生出一组新的组分图像,组分图像的数目可以等于或少于原来的波段数。通过分析进行主成分分析后获得的特征向量值,可判别包含特定物质光谱信息的主分量图像及每个原始波段对感兴趣物质的光谱响应的贡献,并可根据特征向量的大小和符号确定特定物质在主成分图像中的像元分布特征。

图像处理技术大量地应用多元分析方法。多元分析的特点是研究若干观测对象的集合,对每个对象观测p个变量值。在一元分析中人们所熟悉的某些方法可以推广到多维,例如各阶矩阵统计量(均值、离差、偏态度量)和以它们为基础的一些方法(相关、回归、方差分析)。不过多元分析还包括许多新方法:主分量、因子分析、典型相关、分类等。多元分析的内容远比把一维技巧直接推广到p维要多得多。虽然多元方法多种多样,但几乎都要求简化问题的复杂性,即以牺牲一些信息为代价,来降低复杂集合的维数,或者说通过变换而舍弃一些次要参数,达到“从树木看森林”为目的。

例如考虑p个变量的情形,感兴趣的是它们的离差和相关系数。要研究的有p个均值,p个离差和个相关系数,共计个参数。若p=1,则仅有2个参数;若p=2,则有5个参数;若p=10,参数个数达65个之多。显然,如能把变量变换成为一个不相关的集合,就可大大地减少表示这个集合的复杂性,这时有个参数变为零。再者,如将维数从p减为p-n,我们就省略了个参数。从此例可理解:消元和减少相关性是使系统结构简化的两个措施。而主分量分析便是基于变量之间的相互关系,在信息总量守恒的前提下,利用线性变换的方法来实现去相关性的,由于所获各主分量之间不相关,故各主分量之间信息没有重复或冗余。

遥感信息各波段相互之间存在有一定相关性,甚至对某些岩性这种相关性还很强。为了减少各参数间存在的相关性对于分类的影响,人们常使用主分量分析法。

将两个波段(参数)的数据绘成两维图(即变量散布图),由于两参数的强相关性,形成一个长椭圆形图,越靠近对角线,相关性越高,相关性差的数据背离对角线。如将三参数数据在三维空间表示,则对于相关性强的数据可得到一个像纺锤状的椭球体。

一种可改善数据分布的方法是用另一组多维空间,使数据之间的变异最大程度地显现出来,通常采用主分量分析法。图4-3(a)中点的分布可用两参数的平均值和变异来表示,单变量的变异表现出数据在平均值周围的分布;用协方差来衡量两个变量的互变异,当协方差为正,则有正相关性;当协方差为负,则存在逆相关性;当协方差为零时,两参数完全独立,互不相关。

图4-3 K-L变换原理

设有n个像素,共观测了p个参数,Xij表示第j个像素的第i个参数值。每个参数的平均值为:

从均值量起的协方差矩阵为:

式中:X'——X的转置;

C——协方差或离差矩阵。

两参数Xi和Xk的协方差为Xik,即:

若每个变量Xi除以它方差的平方根,那个协方差矩阵就变成相关矩阵:

协方差矩阵和相关矩阵是主对角线对称的,即Cik=Cki,rik=rki。协方差矩阵及行列式在多元理论中起重要作用(类似于一元理论中方差的作用)。

主分量分析或主分量变换的原理示意于图4-2(b)和(c)中。其第一步是移动坐标原点,使平均值为零,见图4-2(b)。在这一步骤后,可将坐标旋转,见图4-2(c),使一个坐标轴与数据具有最大分布的方向相符合,这个旋转后的新轴即第一主分量,它占有总变异的第一份额。垂直于它的另一个坐标轴则代表其余变异的方向,这就是第二主分量。在两维以上的多维空间里,这样的处理将继续进行,以确定一组直角坐标轴,这些轴逐渐将全部变异分配(消耗)掉,它并不能全部包含在一个次一级主分量中,而是有多少个原始参数就会有几个主分量。各主分量变异值的总和与变换前的变异值总和相等,这就是信息量守恒。

原始有几个波段的数据就映射到几个新的主分量上,各主分量是本征向量线性相加组合而成的。在数学中就是找出新变量ξ1,ξ2,…,ξn,它们是X的线性函数,而且彼此不相关,即:

实际上,就是求出p2个常数Lik(i=1,2,…,p)按矩阵表示:

式中:L——特征向量,各Lik是此特征向量的分量;

λ——C矩阵的特征值。

某主分量的特征值就是若消去该主分量后,对相应的本征向量所引入的均方误差值。可见其对各主分量表征的重要性。

若某景PC4的特征向量如表4-3所示,将各波段的贡献系数都除以TM5的贡献系数(0.851),作为TMl、TM4、TM7的投影系数,做成图4-4。作图时,TM5不变;TM7和TM4,以负值投影在TM5上;TMl以正值投影在TM5上;最后得到(PC4/0.851)。便可直观地理解PC4与各波段的关系。

表4-3 某景PC4的特征向量

主分量分析是去相关性处理(以二维数据为例,图4-5)。

第一主分量的确定原则:使其取向代表信息量最大(第一主分量是各个波段的加数和,反映总体的反射值);第二主分量与其正交。

遥感异常提取的技术流程如图4-6所示,流程主要包括预处理和信息提取两大部分。

图4-4 PC4与各波段的关系

图4-5 二维数据主分量分析原理

图4-6 主成分分析法进行矿化蚀变信息提取技术流程图

(据张玉君,2003,略修改)

1. 干扰信息的排除

通过观察干扰信息的波谱特征,灵活的选择不同的方法对可能的干扰信息(边界错位、水、云、云影、植被、雪、河流冲积物、第四纪覆盖物、农田和阴影以及大理岩、花岗岩等)经处理归入干扰窗,形成干扰掩膜,然后用原始数据减去干扰掩膜,从而获得去干扰图像,这样做的目的是尽可能地减少干扰信息对异常提取工作产生的影响。

为了便于遥感矿化蚀变信息提取,需要选择合适的遥感影像(选择时主要考虑数据获取时相、云量覆盖等)。

(1) 去边界错位。ETM各个波段数据在全景中起止列数不一致,ETM1起始列数最左, ETM5终止列数最右,为了获得精确的处理结果应该把左右两边数据不齐的像素去除。这是进行整景图像处理时与局部图像处理不同的第一个问题。具体做法是通过乘法获得边框二值(0,1)图像,如果不取二值图像,那么相乘的结果仍然不能去除边界:ETM1×ETM5,并把结果拉伸为0~255的无符号八位比特数(Unsigned8Bit)。用它对原始图像进行MASK掩膜获得去边界的图像(图4-7)。

图4-7 去边界错位技术流程

(2) ETM1高值区干扰。对于像云、雪和城市建筑物以及部分河流冲积物等干扰信息,它们在ETM1具有比岩石露头更高的亮度,通过ETM1的高值切割基本上能去除这些干扰信息(图4-8)。这里需要注意的是对于不同的景,不能一概选择相同的值切割,要“因景而异”,即使同一个景,不同的时相,选择的切割值也会不同,通过观察来决定切割值。

图4-8 去云、阴影流程图

(3) 水体与居民地。水体的光谱特点是在ETM1具有较高的反射率,而在ETM其他波段反射率较小,因此本次异常提取过程中采用了归一化植被指数(NDVI)来消除水体及居民地等干扰因素的影响。因此,采用NDVI>1剔除水体和居民地(图4-9黑色区域为水体及居民地覆盖区)。

(4) 植被。植被是蚀变信息提取中最常见的干扰信息,它在ETM的1~5和7六个波段光谱曲线的特点是不论阔叶树还是针叶树都在近红外波段(ETM4)处有一个强的反射峰值(阔叶树反射率可达60%~70%,针叶树反射率可达30%左右)。本次进行植被信息的剔除过程中,采用了常用的比值植被指数(RVI)的方法,即ETM4/ETM3,取RVI>1.6为植被覆盖区(图4-10中白色区域为植被覆盖区)。

图4-9 测区水体及居民地掩膜

1.水体、阴影及居民地;2.非水体、阴影及居民地

1.水体、阴影及居民地;2.非水体、阴影及居民地

图4-10 测区植被掩膜

1.植被;2.非植被

1.植被;2.非植被

(5) 河流冲积物。对于河流冲积物的排除要十分谨慎,因为在这些冲积物中包含了一些蚀变矿物所特有的基团因子,因此它们的光谱信息和蚀变岩的光谱信息比较相似。通过观察发现冲积物的光谱亮度在各个波段普遍的都比较高,而且冲积物的分布都是沿着河流沿岸的,根据这一特点用光谱角度制图法(Spectral Angle Mapper)进行去除,光谱角度选择在1.2°。

2. 蚀变信息的提取

针对工作区植被覆盖率高,河流水体及冲积物等干扰信息较多的特点,经过多次的对比研究,采用去干扰异常主分量门限化技术进行大面积遥感矿化蚀变异常信息的提取,建立了植被覆盖地区的遥感矿化蚀变异常提取方法。遥感图像各波段间存在有一定的相关性,为了减少相关性对分类的影响,常使用主分量分析法去相关。主分量分析基于变量值缉拿的相互关系,在信息总量守恒的前提下,利用线性变换的方法来实现去相关性。由于所获各主分量之间不相关,故各主分量之间信息没有重复或冗余。主分量分析的这一基本性质在蚀变异常信息提取中被充分利用。ETM+多波段数据通过PCA所获每一主分量常常代表一定的地质意义,且互不重复,即各主分量的地质意义有其独特性。用ETM+1、ETM+4、ETM+5、ETM+7四个波段进行PCA,删去ETM+2、ETM+3波段,避免3个可见光波段同时参与运算,排除了铁氧化物的干扰,这样在PC4中绿泥石等黏土矿物就突出显示出来,从而得到羟基化物异常,对代表羟基化物主分量的判断准则是:构成该主分量的本征向量,其ETM+5系数应与ETM+7及ETM+4的系数符号相反,ETM+1一般与ETM+5系数符号相同。根据有关地物的波普特征,羟基信息包含于符合这一判断准则的主分量中,故此主分量可称为羟基异常主分量。用ETM+1、ETM+3、ETM+4、ETM+5四个波段进行PCA,删去ETM+2、ETM+7波段,排除了黏土类矿物蚀变信息的干扰,这样在PC4中铁氧化物等就突出显示出来,从而得到羟基化物异常,对代表铁染物主分量的判断准则是:构成该主分量的本征向量,其ETM+3系数应与ETM+1及ETM+4的系数符号相反。本次研究中,羟基异常一般出现在ETM+1、4、5、7做四分量PCA之后的第四主分量中。而铁染异常一般出现在ETM+1、3、4、5做四分量PCA之后的第四主分量中。表4-4和表4-5为测区内ETM+数据的本征向量矩阵和特征值。

表4-4 测区ETM+1、4、5、7波段提取羟基( -OH)异常主成分变换特征矩阵

在确定了包含蚀变异常的主分量之后,就需要进行异常分割。依据主成分分析的原理,对于1、4、5、7波段组合的PCA,如果波段5的符号为负则异常显示为暗,因此需要切割低值区,如果波段5的符号为正则异常显示为亮,需要切割高值区,如表4-4中波段5的在PC4上的符号为负值,因此切割低值区,切割的具体取值需要多次试验才能确定。同理可以确定1、3、4、5波段组合的PCA异常切割的值。

表4-5 测区ETM+1、3、4、5波段铁染异常(Fe2+、Fe3+)主成分变换特征矩阵

3. 矿化蚀变信息的筛选

在经过空间变换增强图像色调分量选取适当阈值分割后,得到褐铁矿化类、碳酸盐化及绿泥石化异常图像。针对遥感图像中成层的岩石信息,借鉴数学地质中有序样品的概念,提出了有序岩石遥感信息的概念,利用最优分割法对遥感图像上选取有代表性的剖面进行划分,可以取得较好的效果并节省大量的计算时间和空间。

在上述方法原理的基础上,项目组经过多次试验,综合考虑了蚀变信息提取过程中的各种影响因素,最终确立了“辐射校正—干扰去除—地貌、岩性分区—主成分+比值—岩性异常剔除”的异常提取方案。首先,工作区地表覆被较多,对异常提取工作形成干扰的多为影像上的阴影区、白泥地、云、水体、植被等,因此应先予以去除;其次,尽管进行了太阳辐射、大气因子、环境因子和地形地物因子等各种校正,但提取出的遥感异常仍然因为岩性、干扰因子去除不完全等各种原因,存在一些假异常,面对这种情况,则需要针对这些“异常”的具体分布状况,采用相应的技术手段对其进行剔除,使矿化蚀变带的分布情况显现出来。所有遥感异常区带,均根据异常特征、成矿地质条件等进行找矿远景分级,并进行3×3滤波处理。一级异常划分阈值使用典型矿床或矿区的遥感异常边界值,二级异常使用矿点或含矿围岩蚀变带的边界值,三级异常使用地层或岩体蚀变带、含矿地质体的边界值。保证调查区内80%的已知矿床、矿(化)点上出现提取后的遥感异常。

遥感异常的筛选应在区域典型矿床遥感找矿模型研究的基础上,根据波谱特征、异常特征、成矿地质条件等,对调查区所有遥感异常区(带)进行筛选与找矿意义分析,根据区域岩性的波谱特征及其与已知蚀变异常的区别,通过比值法、高端切割、低端切割等方法对干扰信息进行二次去除。

由于工作区内以往的工作程度比较低,可借鉴用来进行矿化蚀变信息筛选的成果较少,项目组将主要参照以下原则进行:①两种或两种以上方法提取出的遥感异常能够相互验证着,优先推荐;②以典型区域矿床为感兴趣区,光谱角法筛选后得到的遥感异常优先推荐;③与矿产地质遥感解译圈定的成矿有利地段吻合的遥感异常优先推荐;④遥感异常点点位高程较低、交通比较方便且容易到达,点附近异常相对较强,预期可以直接发现蚀变现象的,优先推荐。此外,对于其他蚀变信息,还可根据光谱特征及多元地质因素综合分析进行筛选推荐。

(1) 异常的多元地质因素综合分析筛选。通过遥感异常与传统遥感方法所确定的“线带环色块”异常区的相互比选,相互验证者优先推荐进行野外检查。利用遥感地质解译的结果,将成矿有利层位、有利的控矿构造、有利的侵入体与经过初步筛选的遥感异常结合起来,无疑会进一步缩小野外检查工作的目标区,提高遥感异常的利用水平。

(2) 异常信息的归类及标定。筛选后的遥感异常根据地质背景、成矿条件、找矿意义等,需利用人工包络线将若干空间位置紧密相连、成矿地质条件相近的遥感异常圈定在一起,根据遥感异常的不同强度、不同类型(羟基、铁染)的套合程度进行归类,并根据标准图幅号按照“从左至右、从上至下”的原则标明重点查证的异常区带号、异常号、经纬度坐标、找矿意义,为矿产检查提供依据(图4-11、图4-12)。

4. 光谱角技术

近年来,一些用于高光谱数据处理的方法,如光谱角等也被引入到多光谱的异常提取中,并取得了一定的成效。光谱角技术(SAM)通过计算一个测试光谱(像元光谱)与参考光谱(实验室光谱等)之间的角度来估算两者之间的相似度(CSES,1992;Kruse等,1993)。

图4-11 铁染异常提取专题图

1.铁染三级异常图斑;2.铁染二级异常图斑;3.铁染一级异常图斑;4.铁染异常区

图4-12 羟基( -OH)异常提取专题图

1.羟基三级异常图斑;2.羟基二级异常图斑;3.羟基一级异常图斑;4.羟基异常区

图4-13 光谱角法原理

假定图像数据已转换为暗辐射或路径辐射偏差消除后的视反射率,光谱维数与波段数相等。SAM通过下式来计算测试光谱ti与实验室光谱ri之间的相似性:

式中nb等于波段数。两个光谱之间的相似性不受向量长度及增益的影响,因而可以减低地形对光照强度的影响。α为0°~90°。

在利用光谱角进行多光谱异常的提取中,由于多光谱的光谱分辨率一般较粗,用典型光谱和地面实测光谱效果一般较差。故多用已知异常区域(已知的矿床、矿点或蚀变带)像元的光谱为参考,计算图像中其他像元的夹角,量度它们之间的相似程度。这实质上是一种监督分类,也就是说要有已知的地质资料。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈