首页 百科知识 模型分析教程

模型分析教程

时间:2022-07-05 百科知识 版权反馈
【摘要】:第三节 数据分析方法为了验证本研究所提出的研究假设,除了问卷调查的调查问卷设计、变量测量和数据收集之外,选择合适的研究方法也是非常重要的过程。本节主要介绍本研究进行数据分析的方法,为后续的数据分析提供方法论依据。数据预分析要做以下工作:第一,将所有有效的原始数据输入到SPSS软件中。

第三节 数据分析方法

为了验证本研究所提出的研究假设,除了问卷调查的调查问卷设计、变量测量和数据收集之外,选择合适的研究方法也是非常重要的过程。本研究主要采用结构方程模型(见本章第一节)来评价正式研究模型和检验研究假设,综合应用SPSS 11.5和LISREL8.51等统计软件进行数据分析和假设检验。本节主要介绍本研究进行数据分析的方法,为后续的数据分析提供方法论依据。

4.3.1 描述性分析

统计分析的目的是研究总体特征。在科学研究中,研究者通过对样本(总体中随机抽取的一部分观察对象)的研究来对总体的实际情况作出可能的推断。因此,描述性分析(Descriptive Statistics)是统计分析的第一步,做好这一步是下面进行正确统计推断的先决条件。为了概括性地把握数据的属性和质量,一方面研究者要对问卷中的所有变量进行描述性分析,包括均值、标准差和缺失值等;另一方面研究者使用频数(frequencies)分析来描述样本在问卷分类中的总体特征。

4.3.2 数据预分析

数据分析的第二个阶段是数据预分析。数据预分析要做以下工作:第一,将所有有效的原始数据输入到SPSS软件中。在输入过程中,电脑中编号要与问卷编号完全吻合;第二,运用SPSS11.5的Recode程序对反向问项的数据进行分值转化,变为正向数据;第三,采用期望最大化(Expectation-Maximization, EM)算法来处理缺失值。期望最大化算法可以从未缺失数据的分布情况中推算出缺失数据的估计值,从而能够有效地使用数据进行分析,来提高统计结果的可信度。

4.3.3 信度与效度分析

信度和效度分析是实证研究过程中的一个重要环节,只有满足信度和效度要求的实证分析,其分析及其结果才能具有说服力。信度(reliability)是指对同一事物进行重复测量时,所得结果的一致性程度,它反映测量工具的稳定性与可靠性,一般用信度系数来评价。信度分析(reliability analysis)用于评价问卷这种测量工具的稳定性与可靠性。效度(validity)就是正确性程度,即测量工具确能测出其所要测量的特质的程度。实证分析中使用较多的效度有内容效度(content validity)、准则效度或效标效度(criterion validity or criterion-related validity)、建构效度(construct validity)[包括收敛效度(convergent validity)、判别效度(discriminant validity)和法则效度(nomological validity)]。准则效度或效标效度变量的每种测量方式与准则(或效标)的一致性(DeVellis,2003)。建构效度(Cronbach&Meehl,1955)是要解决测量工具是否反映了概念或命题的内部结构(袁方,王汉生,2004马尔霍特拉著,涂平等译,2002),也称为理论效度。收敛效度是指测量同一概念的不同问项之间的相关度(袁方,王汉生,2004马尔霍特拉著,涂平等译,2002)。判别效度是指一个测量值与其他应该有所不同的概念之间的不相关程度,包括证明不同构想(或概念)之间缺乏相互关联性。效度分析主要用来分析问卷(或测量工具)测量概念的准确性程度。

4.3.3.1 信度分析

内部一致性信度是最常用的信度评价方法,学者们普遍使用的信度(评价)系数是Cronbachα系数(Cronbach,1951)。Cronbachα系数的计算公式如(4.4)式所示:

α=(4.4)

式中:α表示内部一致性信度系数;

k表示问项数量;

r表示问项之间的平均相关系数

Cronbachα系数值界于0到1之间,但究竟Cronbachα系数要多大,才算有高的信度,不同的方法论学者对此看法也不尽相同。Hair, Anderson, Tathan和Black(1998)指出:Cronbachα值大于0.7时,表明数据可靠性较高;测量问项数小于6个时,Cronbachα值大于0.6时,表明数据是可靠的;在探索性研究中,α值可以小于0.7,但应大于0.5。Nunally(1978)认为α值等于0.7是一个可以接受的量表边界值。对于探索性研究来说,Nunally和Berstein(1994)认为0.6也是可以接受的。在本研究中,笔者使用SPSS11.5软件计算各量表的内部一致性系数。

在验证性因子分析中,学者们使用综合信度系数(Composite Reliability, CR)(Werts, Linn&Jreskog,1974)来作为信度检验指数(罗海成,2005)。综合信度的目的在于评价一个潜变量所属的各个测量变量之间的内在一致性。综合信度CR的计算公式如(4.5)式所示:

CR(4. 5)

式中:CR表示综合信度系数;

λi表示第i个观察变量在潜变量上的因子标准化载荷;

δi表示第i个观察变量的测量误差。

综合信度系数的标准没有一个绝对临界值。有关研究认为或建议该指标的最小临界值为0.7,也有研究认为应该大于或等于0.6(Bagazzi&Yi,1988)。虽然没有一致的标准,但是大多数研究者认为CR 0.5为临界值,0.7则是适中的,0.8以上则较好。

4.3.3.2 效度分析

本研究通过探索性因子分析(Exploratory Factor Analysis, EFA)来检验问卷的建构效度。因子分析可以帮助研究者判断同一变量的不同测量问项是否比较准确地反映了被测量变量的特性,以至可以将这些问项合并为一个因子。笔者运用主成分分析法(Principal Component Analysis),以特征根值大于1为标准来截取数据,并采用方差最大化正交旋转法(varimax)来进行因子分析。按照经验判断方法,当取样适当性数值KMO(Kaiser-Meyer-Olkin measure of samplingadequacy)值大于0.7时,且Bartlett′s球形检验达到显著水平,各问项的载荷系数均大于0.40时,可以通过因子分析将同一变量的各问项合并为一个因子进行后续分析。

收敛效度分析可以通过验证性因子分析进行。在验证性因子分析中,收敛效度水平可以由模型的拟合指数(fit index)和因子载荷系数来检验(Mueller,1996),还可以利用平均析出方差(Average Variance Extracted, AVE)值来判断。如果测量模型的拟合指数都达到可接受水平,则表明测量模型与样本数据达到了较好的契合(或拟合),那么研究者就可以进一步通过因子载荷系数来检验其效度。所有观测变量(或问项)在各自测量的潜变量上的因子载荷都显著的话,则表明测量有较高的收敛效度(Anderson&Gerbing,1988)。在LISREL输出报表中,研究者可以通过标准化的载荷系数和t值来判断显著性。标准化载荷系数应大于最低临界水平0.6(Hatcher,1994),对于新开发的量表来说,0.5或0.6也是可以接受的(Chin,1998)。平均析出方差AVE值主要用来考察观测变量的总方差中有多少是来自于潜变量。一般而言,AVE的临界值为0.5(Fornell&Larcker,1981Fornell,1992)。AVE值的计算公式如(4.6)式所示:

AVE(4. 6)

式中:AVE表示平均析出方差值;

λi表示第i个观察变量在潜变量上的因子标准化载荷;

δi表示第i个观察变量的测量误差。

学术界采用以下四种方法判断数据的判别效度:(1)如果同一个潜变量不同观测变量之间的相关系数比该变量的观测变量与其他变量任何一个观测变量之间的相关系数都高,则表明数据有较高的判别效度;(2)对限定性与非限定性测量模型的χ2值与自由度进行比较分析,先把测量模型中每一组潜变量之间的相关系数固定为1(限定性测量模型),把每组潜变量之间的相关系数设定为待估计参数(非限定性测量模型),分别计算这两个测量模型的χ2值与自由度,然后计算两个模型的χ2值之差与自由度之差。非限定性模型的χ2值显著低于限定性模型的χ2值,表明这一组潜变量并不是两个相同的概念,即数据有较好的判别效度;(3)如果两个潜变量之间的相关系数加减标准误的两倍不包含1,表明数据有较高的判别效度;(4)如果各个潜变量解释的方差(AVE)的平方根大于该变量与其他变量的相关系数,表明数据有较高的判别效度。本研究使用LISREL8.51软件,利用判别效度的第四种方法,即AVE的平方根大于该变量与其他变量的相关系数,来检验测量的判别效度。

4.3.4 模型与假设检验

本研究借助LISREL8.51软件,利用最大似然法进行结构模型的数据分析。Anderson&Gerbing(1988)的两步骤分析方法认为当测量模型的信度、收敛效度和判别效度检验完后,才能进行假设检验。笔者先根据结构模型的拟合指数是否达到可接受水平来判断结构模型和数据的契合程度,然后通过模型的标准化路径系数和显著性检验情况,来考察潜变量之间的路径关系,检验本研究的理论假设是否成立。

4.3.5 模型修正与竞争模型比较

为了探究更优模型存在的可能性,研究者可以利用不同的程序与方法去修正理论预设模型,以提高模型的拟合度,此过程称为模型修正(Model Modification)(Long,1983邱皓政,2005)。修正指数(Modification Index, MI)(Srbom,1989)是指模型中某个受限制的参数(通常是固定为0的参数)在允许自由估计的情况下,整个模型的χ2值所减少的数值。修正指数值很大则意味着将相应参数改变成自由参数会大大地改善拟合程度。模型修正中的重要指导原则就是模型修正始终要以相应的专业理论为基础(侯杰泰,温忠麟,成子娟,2005邱皓政,2005),所修正的参数必须是用理论能够合理解释和有实质意义,同时参照统计检验结果和修正指数来进行(邱皓政,2005)。模型修正可以粗略地分为四类,第一类是增加或减少内生变量;第二类是保持内生变量不变,只增加或减少外源变量;第三类是保持内生变量和外源变量不变,而变动它们之间的路径联系;第四类是保持内生变量、外源变量和路径联系不变,只变动残差。修正模型原则上每次只修改一个参数。本研究在模型修正中采取第三类的改变路径的方式。在LISREL输出报表中,研究者可以取MI大于3.84或6.63的参数作为该路径改变的准则。一般来说,先考虑让那些有最大MI的参数自由估计。

模型是否应该进行修正,最直接的检验方式是检验修正后的模型[称为竞争模型(competitive model)]的χ2值是否显著地优于未修正前的模型的χ2值,也就是说计算修正前与修正后的χ2值的差(Δχ2),配合两嵌套(或巢套)模型(nested model)的自由度差值(Δdf)进行显著性检验来决定模型修正的适当性,此检验称为卡方差检验(chi-square difference test)。卡方差检验的前提条件是两个模型必须为嵌套模型,也就是某一个模型必须是另一个模型的简约模型,即每次修正模型时不要同时改变两种以上的参数。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈