首页 百科知识 主成分分析法对原始数据指标进行筛选

主成分分析法对原始数据指标进行筛选

时间:2022-10-04 百科知识 版权反馈
【摘要】:原始数据的标准化 为了避免不同数量级、量纲等带来的影响,首先应该对原始指标数据进行标准化处理。,p表示p个指标,xij表示第i个样本的第j项指标值。≥λp≥0,它是主成分的方差。k值由方差贡献率决定。

2.1 主成分分析法原理

主成分分析方法就是把原来具有相关性的指标重新组合成一组新的综合性指标来代替原来指标的一种统计方法。

2.2 主成分分析步骤

(1)原始数据的标准化 为了避免不同数量级、量纲等带来的影响,首先应该对原始指标数据进行标准化处理。设有n个样本,p项指标,就可以得到数据矩阵x= (xij)p ×p ,i =1,2,…,n表示n个样本,j=1,2,…,p表示p个指标,xij表示第i个样本的第j项指标值。用Z-score法对数据进行标准化变换:

商州区、洛南县、丹凤县、商南县、山阳县、镇安县和柞水县原始数据标准化指标结果(表1-3-2)

表1-3-2 标准化数据

(2)求指标数据的相关矩阵

式中:j = 1,2 ,…,p; k = 1,2 ,…,p; rjk为指标j与指标k的相关系数

即:

根据以上方法,求出已经标准化的原始数据矩阵的相关矩阵见表1-3-3。

表1-3-3 相关系数矩阵

(3)求相关矩阵R的特征根与特征向量以及求方差贡献率,确定主成分,由特征方程式|λip-R| =0,可以求得P个特征根λg(g =1,2,…,p) ,将其按大小顺序排列为λ1≥λ2≥…≥λp≥0,它是主成分的方差。每一个特征根对应一个特征向量:

把标准化后的指标变量划为主成分:

F1表示为第一主成分,F2表示为第二主成分…… Fp为第p主成分(x为指标) 。

(4)求方差贡献率来确定主成分的个数 在一般情况下,主成分个数就是原始指标的个数,主成分的分析方法就是选取尽量少的k个主成分(k <p)来将其进行综合评价。 k值由方差贡献率决定。

根据以上算法,可以得到特征根、特征向量,见表1-3-4、表1-3-5。

表1-3-4 相关系数矩阵的特征值

表1-3-5 成分矩阵

续表

图1-3-2 主成分碎石图

2.3 主成分得分计算

主成分计算公式为:

根据主成分得分的计算公式来计算主成分:

其中:a为主成分除以λ1-5的开平方,x1-m为标准化的自变量,即各项指标的标准化数据,依据表1-3-4,表1-3-5和公式1.12得到各个主成分和一区六县综合得分表达式:

y1=-0.290Zx1+0.337Zx2+0.011 Zx3-0.079Zx4-0.006Zx5+0.403Zx6+0.206Zx7+0.240Zx8+0.022Zx9+0.233Zx10-0.050Zx11+0.391Zx12+0.410Zx13 +0.389Zx14-0.067Zx15

y2=-0.161Zx1+0.235Zx2+0.285Zx3-0.057Zx4+0.115Zx5-0.064Zx6+0.336Zx7-0.341Zx8+0.446Zx9-0.340Zx10+0.429Zx11-0.006Zx12-0.028Zx13-0.025Zx14-0.295Zx15

y3=0.276Zx1-0.138Zx2+0.479Zx3-0.578Zx4+0.252Zx5+0.144Zx6+0.154Zx7+0.090Zx8-0.110Zx9-0.023Zx10+0.084 Zx11-0.063Zx12-0.038Zx13+0.119Zx14+0.430Zx15

y4=-0.410Zx1+0.099Zx2-0.119Zx3+0.028Zx4+0.753Zx5-0.148Zx6+0.010Zx7-0.022Zx8-0.150Zx9+0.176Zx10-0.016Zx11-0.225Zx12+0.186Zx13-0.259Zx14+0.104Zx15

y5=0.159Zx1+0.155Zx2+0.360Zx3+0.576Zx4-0.027Zx5+0.027Zx6+0.237Zx7-0.285Zx8-0.099Zx9+0.321Zx10+0.014 Zx11+0.242Zx12-0.059Zx13-0.188Zx14+0.374Zx15

y=5.517y1+4.672y2+1.730y3+1.456y4+1.098y5

一区六县主成分综合得分见表1-3-6。

表1-3-6 一区六县生态经济主要指标主成分综合得分

从表1-3-6可知,商洛水源地生态经济主成分综合得分从大到小依次为山阳县(15.76) 、洛南县(14.97) 、镇安县(13.86) 、商州区(6.36) 、商南县(-8.87)、丹凤县(-19.17)和柞水县(-22.91) ,说明山阳县、洛南县、镇安县和商州区生态经济水平在商洛水源地主要生态经济平均水平以上,而洛南县、丹凤县和柞水县生态经济发展水平低于研究区生态经济平均水平。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈