首页 理论教育 因子分析怎么影响变量

因子分析怎么影响变量

时间:2022-03-29 理论教育 版权反馈
【摘要】:由于受样本调查统计时间的限制,本书仅对量表的内在信度进行测量,以Cronbach’s Alpha系数作为评判标准。为了测度量表的结构效度,我们选取因子分析方法进行检验。因子分析是通过研究相关矩阵或协方差矩阵内部依存关系,将多个变量X1, X2,…在因子分析中,一般将A、F分解为两部分:则因子模型为: X=AF+A1F1+A2F2=A1F1+e,其中,X为农合组织生命系统中P个指标(可观测) 构成的列向量,A1为
数据分析方法_中国西部农业合作经济组织生命系统发展研究

一、信度效度分析

信度和效度检验是实证研究过程中的一个重要环节,只有满足信度和效度要求的实证研究,其分析过程与研究结果才具有说服力。信度分析是一种测度、综合评价指标是否具有一定稳定性和可靠性的有效分析方法,主要对量表的有效性进行研究。量表的信度分析包括内在信度分析和外在信度分析。内在信度分析是指考察一组评估项目是否测量同一特征,这些项目之间是否具有较高的内在一致性。外在信度分析是指在不同时间、对同批被评估对象实施重复测量时,评估结果是否具有一致性。由于受样本调查统计时间的限制,本书仅对量表的内在信度进行测量,以Cronbach’s Alpha系数作为评判标准。经验上,如果Cronbach’s Alpha系数大于0.9,则认为量表的内在信度很高; 如果系数在0.8与0.9之间,则认为内在信度可以接受: 如果系数在0.7与0.8之间,则认为量表设计存在一定问题,但仍有一定的参考价值 (赵建欣,2008)。

效度分析主要是检查测试方法的适用程度,是保证我们从研究中得出正确结论的基础。本书主要进行问卷项目的内容效度和结构效度的检验。在内容效度上,我们采用的量表主要来自已经较为成熟的理论、国内外的相关研究以及实践调研,并采用德尔菲法请有关专家做了审查,这些可以保证量表具有较好的内容效度。为了测度量表的结构效度,我们选取因子分析方法进行检验。研究中通过主成分分析和信度分析,对指标体系进一步进行验证。

二、因子分析

(一) 因子分析法概述

为了能更加清晰和全面地识别被评估对象各方面的特征,在实际应用中,往往选用尽可能多的评估指标对被评估对象进行测评,指标选取的越多,越能全面和客观地反映事物的所有特征,但是选取如此众多的评估指标,却给实际测评和数理统计分析带来了不可避免的困难和麻烦: 首先,选用太多的指标变量会给数理计算带来很大的困难,使评估分析变得复杂。其次,经过对指标变量的大量收集,收集到的指标之间可能存在相关性,浪费了大量的人力、物力和财力。而因子分析方法刚好是解决以上问题的一种有效的方法。

因子分析方法最早是由K.Pearson和C.Spearman等学者于20世纪初在研究社会心理学中提出来的。因子分析是一种重要的降维方法,目的是用几个特定变量来解释原始变量之间的相关关系。它是主成分分析的推广和发展,它用几个不可测的因子来对原始变量之间的相关关系进行解释,然后将因子进行分类和命名,尽可能用较少的变量来解释较多的原始变量,减少计算分析的复杂度。因子分析方法主要通过分析事物内部之间的因果关系来抓住事物本身的主要矛盾,找出事物内部的基本规律。

因子分析的基本思想就是通过变量的相关系数矩阵或协方差矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,然后根据相关性大小将这些变量分成若干组,使一个组内的变量之间相关性较高,使组与组之间的变量的相关性较低。我们将这些已经分好的组称之为公共因子或主因子,这些公共因子或主因子是对原始变量之间相关性起主要作用和影响的基本结构。在社会统计中,从一些复杂的事物的内部找出和总结出几个主要因子,即公共因子,通过抓住这些公共因子的特征从而帮助我们全面分析和把握事物的本来面目,找出规律。

因子分析是通过研究相关矩阵或协方差矩阵内部依存关系,将多个变量X1, X2,…,Xp(可以观测的随机变量) 综合为少数几个因子F1,F2,…,Fm(不可观测的潜在变量),以再现指标与因子之间的相关关系。因子分析方法的分析步骤和流程如下:

1. 将原始数据进行标准化处理

数据的标准化处理包括指标趋同化处理和指标无量纲化处理两部分。

第一,指标的趋同化处理方法。指标的趋同化处理也叫指标的正向化处理。在农合组织生命系统模型中,有些指标的指标值越大,表示其评价越好,这样的指标称为正向指标; 而有些指标的指标值越小,表示其评价越不好,这样的指标称为逆向指标; 还有些指标的指标值越接近于某一个数值,就表示这个指标的评价越好,这样的指标称为适度指标。因此,要根据不同类型的指标进行趋同化处理,要将逆向指标和适度指标转化为正向指标,这个过程也叫指标的正向化。这个正向化过程可以在指标的无量纲化处理前进行,也可以在指标的无量纲化处理的同时进行。

趋同化处理的方法有很多,比如说,逆向指标可以利用取倒数或者取负数的形式转化为正向指标,适度指标可以通过指标减去适度值后的绝对值的负数的形式转化为正向指标。

第二,指标的无量纲化处理方法。不同的指标往往具有不同的量纲,各个指标数据的数值大小、标准不同,最后得到的总的评价标准也就缺乏统一的规范,没有一个评价标准,因此,处理指标数据时,必须对指标数据进行无量纲化处理。所谓无量纲化,就是对指标数据进行正规化、标准化处理,以消除指标量纲的影响,将性质、量纲不同的指标通过一定的数学变换转化为可以统一评价的一个相对数量值。

其中,无量纲化方法包括非线性和线性两种方法。线性方法是指无量纲值与指标值之间是一种线性关系,非线性方法是指无量纲值与指标值之间是一种非线性关系。非线性方法的公式有很多,但是其计算程序非常复杂,因此,在实际应用中很少用到非线性方法,而比较常用线性方法。目前,我们比较常用的线性无量纲化方法有3种: 标准化法、均值化法和极差正规化法。

从各种方法的适用性可以看出,标准化法和均值法必须在尽可能多的评估样本的前提下才会保证精确性和客观性。因此,这两种方法不适用于评估样本较少的情况,只适用于评估样本比较多的情形。一般地,我们对主观定性指标测评时,大多采用标准化方法; 当对客观定量指标进行测评时,大多采用于均值化方法。

2. 求相关矩阵或协方差矩阵R的特征值和特征向量

标准特征方程 R-PI =0求出相关矩阵或协方差矩阵R的特征向量矩阵A和特征值P1≥P2≥…≥P,并使F=A’X,其中F为主因子矩阵。

3. 建立因子模型,并估计有关参数。

在因子分析中,一般将A、F分解为两部分:则因子模型为: X=AF+A1F1+A2F2=A1F1+e,其中,X为农合组织生命系统中P个指标(可观测) 构成的列向量,A1为因子载荷矩阵,F1为m个因子构成的不可观测向量,e为特殊因子。因子模型可具体写成:

X1=a11f1+a12f2+…+a1mfm+a1e1

X2=a21f1+a22f2+…+a2mfm+a2e2

Xp=ap1f1+ap2f2+…+apmfm+apep

上式中f1,f2,…,fm为主因子,是分别反映某一方面信息的不可观测的潜在变量; aij为因子载荷系数,是第i个指标在第j个因子上负荷,若某指标在某因子中作用大,则该因子载荷系数就大,作用小则该因子载荷系数就小; ei为特殊因子,实际建模中可忽略。

待估计的参数包括: 公共方差、公共因子数、因子贡献率以及因子载荷系数等。参数估计的方法很多,在SPSSl6.0统计软件中,主要有主成分分析法、极大似然法、主因子旋转法等,我们一般在提取公共因子时比较常用的是主成分分析法。

4. 确定因子贡献率及累计贡献率

第j个因子的贡献率为dj,贡献率表示每个因子的变异程度占全部因子变异程度的比率。贡献率越大,说明该因子对总体样本的作用越重要。累计贡献率表示若干个公共因子累计反映原始变量的重要程度,我们一般选取主因子时要考虑因子的累计贡献率,一般选择累计贡献率≥85%的因子个数作为主因子个数。

5. 因子载荷矩阵变换

通过因子模型矩阵可以得到初始因子载荷矩阵,当因子负荷相差不大时,对因子解释会存在困难,这时,就需要对因子载荷矩阵进行旋转。对因子载荷矩阵进行旋转的方法主要有正交旋转和斜交旋转两种,不同的旋转方法会得到不同结果。在SPSSl6.0统计软件中,我们一般较常用的是正交旋转法,也是默认的方法。

6. 构造综合评价模型,计算总得分值

通过因子旋转和计算,可以得到新的因子载荷矩阵A1,和因子得分系数矩阵B。综合评价模型为:

Score=∑djfj=∑djbijxi

式中dj为因子贡献率; fj为因子得分; bij为因子得分系数,由转换后的因子载荷A1求逆得到; xi为标准化的指标值。

(二) 因子分析法在农合组织生命系统构建中的适用性分析

构建农合组织生命系统指标体系必须解决以下主要问题: 首先,由于农合组织生命系统的多元性、复杂性和系统之间具有较强的相关性,使得在农合组织生命系统指标的确定上显得十分复杂和困难; 其次,农合组织生命系统涉及的广泛性使其需要建立尽可能多的指标,而众多的指标必然浪费大量的成本; 再次,指标之间权重的确定会对研究结果产生很大影响。一方面会导致过高或过低估计研究对象造成误差,使最后的统计结果不能真实反映实际水平; 另一方面,会使研究对象片面追求权重较高的指标或进行数据操纵,虚增某些绩效指标。因子分析法本身所具备的特点可以很好地解决上述问题,在处理农合组织生命系统这种多指标多变量的问题时,因子分析法具有其他方法无可比拟的优点:

第一,利用因子分析法可以针对农合组织生命系统多维度、多变量和复杂相关的特点,从众多的指标中进行科学归类,解决指标之间的复杂相关性,简化分析过程,找出公共因子进行实证分析和综合评价。同时可以减少因为指标过多造成评估成本增加的问题。

第二,因子分析法可以避免因为主观因素造成指标权重确定不科学的缺陷。在软件运行中,指标权重的确定是按照一定的计算程序得出,不能凭主观经验随意设定。这样可以避免人为主观因素的影响,客观和科学地构建农合组织生命系统指标体系。

第三,因子分析法可以通过计算机统计分析软件SPSS操作完成,具有很强的可行性和可操作性。可以对事先录入的原始数据进行统计检验、抽取公共因子、输出数据结果等,整个计算过程简单易行,便于操作。

综上所述,因子分析法是农合组织生命系统构建中的首选方法,我们可以运用因子分析法得出农合组织生命系统发展评价模型,进而对被评估的对象进行综合排名。这样,可以节省大样本的农合组织生命系统发展水平评估过程中的大量成本,避免造成人、财、物的浪费。

三、聚类分析

聚类分析又称群分析,它是对样品或变量进行分类的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合。为了将样品进行分类,就需要研究样品之间的关系,一般是根据相似系数和样本的空间距离来进行分类,相似系数越接近于1 (或-1) 或空间距离较近的点归为一类,相似系数越接近于0或距离较远的点应属于不同的类。

聚类分析法的突出优点是,它能够生成比较规整的类集合,聚类结果不依赖元素的初始排列或输入次序,与聚类过程的先后次序无关,聚类结果比较稳定,不易导致类的重构。因此本书选用聚类分析对西部农合组织调研样本进行分类。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈