首页 百科知识 主成分分析的计算步骤

主成分分析的计算步骤

时间:2022-07-13 百科知识 版权反馈
【摘要】:设有n个样本,每个样本观测指标(即变量):X1,X2,…,Xp构成原始数据矩阵:则主成分分析的主要计算步骤如下:步骤1:将逆指标变换为正指标,通常取负或取其倒数。,xp)′的p个变量综合成p个新变量;新的综合变量可以由原来的变量x1,x2,…步骤5:计算累计贡献率Mk,并根据累计贡献率Mk的大小来确定主成分的个数。

设有n个样本,每个样本观测指标(即变量):X1,X2,…,Xp构成原始数据矩阵:

则主成分分析的主要计算步骤如下:

步骤1:将逆指标(越小越好的指标)变换为正指标(越大越好的指标),通常取负或取其倒数。

步骤2:原始数据标准化,消除由于数据量纲不同带来的不利分析的影响。 变量标准化公式为:

其中,xj和 var(xj)分别表示第j个变量的均值和标准差。

为方便记,假定原始数据经过标准化后仍然用X表示,那么,X=(x1,x2,…,xp)′的p个变量综合成p个新变量;新的综合变量可以由原来的变量x1,x2,…,xp线性表示。即:

并且满足

步骤3:建立数据阵X的相关系数矩阵:R=(rijp*p

步骤4:求R的特征根λ1≥λ2≥…≥λp≥0及对应的特征向量ei(i=1,2,…,p)。

步骤5:计算累计贡献率Mk,并根据累计贡献率Mk的大小来确定主成分的个数。一般的,当Mk≥85%时,取前k个主成分来代替原来的p个指标变量的信息。其中,第i个主成分的表达式为:

Fi=a1iX1+a2iX2+…+apiXp,i=1,2,…,k (4.4.9)

步骤6:计算主成分负荷:

由此,可以进一步计算得到主成分得分:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈