首页 理论教育 主成分个数确定的原则

主成分个数确定的原则

时间:2022-02-12 理论教育 版权反馈
【摘要】:主成分个数的确定对于合理、正确运用主成分分析方法十分重要,主成分取得过少不能反映原始变量中的主要信息,而取得过多有可能引入不必要的噪声和误差。一般情况下,通常采用以下几种方式确定主成分个数。为前m个主成分的累计方差贡献率或累计贡献率。利用特征值与因子数目的曲线,特征值大小随主成分数目增加迅速下降,到某一主成分数后,特征值减小幅度变化不大,此转折点的主成分个数即为m。

6.1.7 主成分个数确定的原则

主成分个数的确定对于合理、正确运用主成分分析方法十分重要,主成分取得过少不能反映原始变量中的主要信息,而取得过多有可能引入不必要的噪声和误差。在光谱信息的压缩和抽提中这一问题尤为突出。一般情况下,通常采用以下几种方式确定主成分个数。

1.根据累计方差贡献率判断主成分数

设变量xi的方差var(xi)=img500,可以证明

img501

这表示原有变量的总方差等于新的综合变量(主成分)的总方差。

因此可以用下面这些定义来度量主成分所包含的原有变量的信息,将

img502

称为第i个主成分的方差贡献率或贡献率,而称

img503

为前m个主成分的累计方差贡献率或累计贡献率。可见累计贡献率表示前m个主成分从原来的p个变量x1,x2,…,xp中提取了多少信息。通常由ηm的大小决定应该用多少个主成分来替代原变量,且当ηm的取值达85%~95%,或在此之上时,可以确定保留这m个主成分比较合适,而其余对应特征值较小的主成分可以略去。

除此之外,还可采用如下准则确定主成分数。

2.其他准则

(1)特征值大于1.0的因子数定为主成分数。

(2)利用特征值与因子数目的曲线,特征值大小随主成分数目增加迅速下降,到某一主成分数后,特征值减小幅度变化不大,此转折点的主成分个数即为m。

(3)保留那些与一个以上变量有重大关系的主成分。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈