首页 理论教育 数据分析的基本统计原理简介

数据分析的基本统计原理简介

时间:2022-03-10 理论教育 版权反馈
【摘要】:结构方程模型又称为协方差结构模型,是基于变量的协方差矩阵来分析变量之间关系的一种统计方法,它是多变量分析的一项重要内容,它通过潜变量概念使得对多变量之间复杂的相互关系研究实现了一个重要的方法性突破,被认为是解决社会科学领域中复杂的多元关系的一个强有力的工具,并成为新一代十分重要的数据分析技术。

第一节 数据分析的基本统计原理简介

结构方程模型(SEM)又称为协方差结构模型,是基于变量的协方差矩阵来分析变量之间关系的一种统计方法,它是多变量分析的一项重要内容,它通过潜变量概念使得对多变量之间复杂的相互关系研究实现了一个重要的方法性突破,被认为是解决社会科学领域中复杂的多元关系的一个强有力的工具,并成为新一代十分重要的数据分析技术。

结构方程模型在应用一般统计检验方法前提下,整合了路径分析与因子分析两种统计方法,既可以分析变量之间的相互因果关系:包括了因子分析与路径分析的优点,又弥补了因子分析的缺点,考虑了误差因素,不需要受到路径分析的假设条件的限制(侯杰泰、温忠麟、成子娟,2002)。结构方程模型可同时分析一组具有相互关系的方程式,尤其是具有因果关系的方程式,这种可同时处理多组变量之间的关系的能力,有助于研究者开展探索性分析和验证性分析:当理论基础薄弱、多个变量之间的关系不明确,而无法确认因素之间关系的时候,我们可以利用探索性分析,分析变量之间的关系;当研究有理论支持的时候,我们可以用验证性分析来验证变量的关系是否存在。

因此,结构方程模型是评价理论模型与经验数据一致性的新型模型,一个标准完整的结构方程模型应当由测量模型和结构模型两部分组成。测量模型用来描述观测变量(指标)与潜变量(因子)之间的关系,它主要是通过验证性因子分析(CFA)来识别潜变量(因子)的观测变量(指标)和评价每个潜变量(因子)的可靠性,为评估后面因果关系做必要的准备;而结构模型是指模型中各个潜变量(因子)之间的一系列的关系,可以用来检验待验证的各条路径的统计显著性。

对于观测变量(指标)与潜变量(因子)之间的关系,即测量模型可以写成如下的联立方程形式:

x=Λxξ+δ

y=Λyη+ε

式中:x,y分别是外生观测变量(指标)与内生观测变量(指标);

   ξ,η分别是外生潜变量(因子)与内生潜变量(因子);

   Λx,Λy分别是x与ξ和y与η的关系,一般用因子负荷矩阵来表示;

   δ,ε分别是x与y的测量误差。

测量模型的假设条件为:

第一,误差项的均值为零,即E(δ)=0,E(ε)=0;

第二,误差项与潜变量(因子)之间不相关,即cov(ξ,δ)=0,cov(η,ε)=0。对于潜变量(因子)之间的关系,即结构模型可以写成如下的方程形式:

η=Bη+Γξ+ζ

式中:η为内生潜变量(因子);

   ξ为外生潜变量(因子);

   Β为内生潜变量(因子)之间的关系;

   Γ为外生潜变量(因子)对内生潜变量(因子)的关系;

   ζ为结构方程残差项,反映η在方程中未能解释的部分。

对于结构模型以及结构模型和上述测量模型中相关变量的关系,主要有以下两项假设:

第一,结构方程残差项ζ的均值为零,即E(ζ)=0;

第二,残差项ζ与ξ以及测量方程中的δ和ε不相关,即cov(ξ,ζ)=0,cov(ζ,δ)= 0,cov(ζ,ε)=0。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈