首页 百科知识 多变量描述统计

多变量描述统计

时间:2022-06-20 百科知识 版权反馈
【摘要】:三、多变量描述统计前面讨论一个自变量和一个因变量关联的有无、大小、强弱、方向和统计显著性。实验研究是采取实验组和控制组对比方法,而管理研究中,实验方法的运作难度较大,常采用统计控制方法,对控制变量的观察加以处理,凸现自、因变量之间的关联。反映自变量和因变量关系的表称为零级表,“零”意味着未引入另外的控制变量。然而,引入另一自变量后,便有可能对投票行为给予不同解释。

三、多变量描述统计

前面讨论一个自变量和一个因变量关联的有无、大小、强弱、方向和统计显著性。然而管理研究中一般会面临两个以上的变量,假设检验中也要处理多个变量,可以说多变量数据分析方法是管理研究人员离不开的工具及必须掌握的基本功。

研究多个自变量与一个因变量之间的关联问题主要出自两个原因,一是为了能够充分地解释某种现象,二是探索现象的成因。管理现象如果由一个自变量就能解释清楚当然是求之不得的事情,但事实上很难做到。一个企业的利润指标改善,可能是提高产品质量、降低成本、调整营销策略等多方面活动的结果,关联因素很多,要解释清楚势必是多变量问题。至于现象的成因,更离不开多变量分析,两变量间强相关,不一定就是因果关系,可能两者都是由第三个变量引起的。例如,有项研究发现,城市交通死亡事故率和汽车强制性检修制度强相关,有强制性检修制度的城市交通死亡事故率较低。然而并不能由此断定强制性检修制度就是该城市事故率低的原因,还有人口密度、交通信号标示系统、交通监督管理系统等因素的影响,只有排除了这些因素作为原因事件的可能性才能作出“检修制度”是原因事件的判断。

本节先讨论适用定类、定序变量多变量关联表,再讨论适用于定距和定比变量的多元回归分析。

(一)多变量关联表

上面提到,因果关系分析中要引入第三个甚至更多个变量才能分析出自变量对因变量的效应以及是否是原因事件,这其实是第四章讨论过的实验研究的思路,分析两变量间的关联时,取第三个或更多个变量作为控制变量。实验研究是采取实验组和控制组对比方法,而管理研究中,实验方法的运作难度较大,常采用统计控制方法,对控制变量的观察加以处理,凸现自、因变量之间的关联。多变量关联表(multivariate crosstatulation)就是沿此思路进行分析的。

多变量关联表分析,有的文献称之为细化分析(elaboration)。细化分析时引入第三个变量,按此变量的属性来分别考察自变量和因变量之间的关系。图5-5说明细化分析的过程。为了简化起见,各变量只含两种属性。反映自变量和因变量关系的表称为零级表,“零”意味着未引入另外的控制变量。引入控制变量后得出各种细分表,如只有一个控制变量,此细分表为一级细分表,一级细分表的数量和控制变量的属性值有关,每个属性相应有一个细分表,相当于按控制变量的某个属性进行一次试验的结果,图5-5中控制变量有两个属性值z1和z2,相应有两个一级细分表,构成多变量关联表。如果有更多的控制变量,则称为二级细分表、三级细分表等。不过实用上,一般只应用一级细分表,因为控制变量越多则细分表数目迅速增加,操作困难,同时,细分表划分愈多,则表中各元素的样本量随之减少,其结果的可信度降低。本例的零级表中,样本分给表内的四个要素,而分到一级细分表,每个要素平均只有1/8的样本数。

图5-5 细化分析

引入控制变量并形成一级细分表后,可能有四种结果,如图5-6所示。

第一种无效应(图5-6(a))。一级细分表和零级细分表的结果相同或相似,这意味着引入的控制变量和自变量及因变量都无关联。

第二种干预效应(图5-6(b))。从时序关系来看,自变量对因变量产生作用的过程中,或者先通过控制变量,或者同时受控制变量的作用而产生影响。当此控制变量在受控的情况下,零级表和一级细分表所反映的自、因变量间的关联强度应保持一致。

第三种掩盖效应(图5-6(c))。零级表显示的并非自变量和因变量两者直接存在的关联强度,而是控制变量z对x和y作用的结果。例如,统计数据表明火灾现场的消防车辆出动数量和火灾损失额呈正相关。显然,消防车辆数量多并不引起火灾损失,而是另外一些变量如火灾场所、涉及范围等,既影响消防车辆出动数量又影响火灾损失额。当火灾场所等控制变量处于受控情况下时,在一级细分表中车辆出动数量和火灾损失额的正相关效应将消失。

图5-6 控制变量作用方式

(a)无效应; (b)干预效应; (c)掩盖效应; (d)抑制效应

第四种抑制效应(图5-6(d))。控制变量z对x和y产生影响,同时x,y之间也直接相关。如图中所示,z和y负相关,表示在零级表中,未受控制的控制变量z已抑制了x,y之间的相关强度。在一级细分表中,剔除了控制变量的影响,自变量和因变量相关程度或者更强或者更弱,视三变量之间相互影响强度而定。

实际上碰到的棘手问题是这些效应的交互作用。自变量和因变量的关系视控制变量的属性值而定,这时一级细分表会反映出不同效应。例如,某一个一级细分表系无效应,而另一个表现为干预效应等,这种情况下就不能简括地说三个变量之间存在某种单纯关系,只能说在条件Ⅰ下属“无效应”的关联,条件Ⅱ下系“干扰效应”的关联,等等,四种效应可能有不同组合。

上述分析只限于最简单的情况,即自变量和因变量只有两个属性值,控制变量只有一个。实际情况要复杂得多,原因事件的判断可以按照细化分析的思路进行。

例5.1 某单位民主选举本单位领导,候选人有甲、乙两人。选举前调研人员欲预测投票情况。甲、乙原来都是本单位的职工,每个职工心目中已有自己的评价,或倾向甲或倾向乙。但调研人员认为,群众对待人事改革政策很关心,改革力度大或基本维持原状的小力度改革也影响选票去向,并形成一种研究假设:“赞成改革力度大的职工倾向投甲的票”。

根据抽样调查结果得出关联表5-10,从此表看,似乎上述假设得到证实,有64%赞成改革力度大的职工投甲的票。然而,引入另一自变量后,便有可能对投票行为给予不同解释。设想引入个人年收入作为控制变量,其属性分为高、中、低三档。将1000个样本数据按年收入得出多变量关联表如图5-7所示,从一级细分表可以看出,按高、中、低收入划分样本后,候选人的人事改革政策和选票去向之间就不相关。不管改革力度如何,80%的高收入职工及60%的中收入职工和30%的低收入职工都会投甲的票,每一组收入属同一档次的职工,投票结果不受改革力度大小的影响。可见,最初提出的改革力度与选票相关的假设是不真实的,投票结果主要是由于年收入这个自变量的作用。然而,上述结果并不表明人事改革政策与选票去向之间不相关。表5-10的关联表已显示出两者的关联,这种现象是由于人事改革政策和第三个变量即年收入相关所造成的。

表5-10 例5.1关联表

现在设定改革力度为控制变量,考察年收入和选票去向两变量之间的关联,表5-11为一级细分表。从细分表显示的结果可见,年收入作为自变量与作为控制变量的分析结果都是一样的。可见,年收入和改革力度这两个变量中,年收入对于解释选票去向更为重要,年收入较改革力度更有可能成为原因事件。年收入影响职工对改革政策的态度,而对改革政策的态度改变不了个人年收入状况,所以,这三个变量的关系应该是年收入影响因变量(选票去向),同时年收入又影响对改革政策的态度,而对改革政策态度又影响因变量(类似图5-6(d)的情况)。

图5-7 多变量关联表示例

表5-11 例5.1一级细分表

(二)偏相关分析和多元回归

多变量关联分析方法,通过控制第三个以至更多个变量揭示变量间的关联,适用于控制变量的属性值为离散型的情况,而且,对于定序、定类尺度,多变量关联分析是唯一的适用方法。但这种按控制变量属性归类分析的办法,三个变量还可以,随着变量数增加,细分表的级数增多,模型就越复杂,且每个控制组的样本数据减少。为此,人们就要寻求其他能适用于定距、定比尺度下的多变量关联分析方法,这方面最通用的技术当属偏相关分析和多元回归。细化分析方法的思路是“控制”第三个变量的属性值,偏相关分析和多元回归的思路则是“调整”(adjustment)第三个变量的效应。

1.偏相关分析

偏相关表示在消除第三个变量的影响后,自变量和因变量的关联程度。例如,欲分析个人受教育水平和工作绩效之间的关联,两者的关联又受年龄影响(图5-8)。偏相关分析首先用一元回归分析年龄(自变量)和教育水平(因变量)之间的关系,回归方程的残差项说明“教育水平”不能由“年龄”来解释的那部分偏差,然后,再求出年龄和工作绩效(因变量)的回归方程及其残差,反映不能由“年龄”来解释“工作绩效”的偏差。最后,用第三个回归方程来分析第一个回归方程和第二个回归方程残差之间的关联,它显示出消除“年龄”对其他两变量的影响时教育水平和工作绩效之间的关联,由此两组残差算出的相关系数即偏相关系数。偏相关系数表示控制变量的影响消除后因变量可解释偏差部分,此系数平方后便是可解释偏差在因变量总偏差中所占的比例。

图5-8 偏相关示意图

实际运用时,可直接算出偏相关系数:

img123

式中,k——控制变量;

   i,j——自变量和因变量。

右端的各相关系数可按i,j双变量的相关分析得出。

设上例中,年龄和教育水平相关系数为+0.38,年龄和绩效的相关系数为+0.50,则教育水平和工作绩效的偏相关系数为:

img124

偏相关系数可以按不同的控制变量计算出来。因而,可以显示在消除了一个或多个控制变量的影响后,自变量和因变量的相关关系发生了什么变化。偏相关系数可以表示两变量间的关联强度,但不能反映两者之间变化的定量关系,即不能回答绩效提高到某水平后,教育水平应提高多少,回归分析可以提供这类信息。

2.多元回归分析

前述一元回归直线分析中,涉及二维空间的数据散点图,并据此求出贴近这些数据点的直线。回归方程描述两变量的定量变化关系,而相关系数表示两者的关联的强度并借以判断关联的统计显著性。回归方程可用来计算任何x值情况下y的预测值,以及每次观测中y的观测值和预测值之差,即残差。

多元回归分析的内容和功能与一元回归分析完全一样,只是回归方程中包含两个或更多的自变量,回归系数表示方程中其他自变量受控的情况下一个自变量与因变量的关联,这里所谓“受控”,并非将样本数据按受控的自变量属性值归类,而是“调节”每个样本的变量属性值。

多元线性回归方程一般表述为:

y=b1x1+b2x2+…+bnxn+a

此式表示y的截距为零的情况,bi表示自变量xi变化一单位时在其他自变量保持不变的情况下因变量y的变化量,a表示随机误差。当给定方程中各个自变量之值时,便可算出y的预测值。

需要指出,多元回归方程并不能反映出各个自变量的相对重要性,因为bi值与自变量的度量尺度有关,bi大于bj并不表示xi和y的关联较xj和y的关联更强,可能是由于xi采用较小的尺度单位。

为了评判各自变量的相对重要性,回归方程的系数bi可以标准化,即顾及各变量的均值和标准差。标准化后,各回归系数bi转换成标准化回归系数βi(beta),它可以反映出在解释因变量y的变化中多个自变量的相对重要性,βi值在-1~+1之间,它表示引起因变量变化的方向以及变化的数量。

从多元回归方程可以检验自变量和因变量关联的统计显著性。计算机程序算出多元回归方程的同时,会输出回归系数的标准差(standard error),此数据可用来检验显著性,如在0.05的显著水平下,回归系数至少要大标准差一倍,否则,此自变量和因变量关联的假设便不可接受。

一个多元回归方程对于因变量总偏差的解释程度与一元回归方程类似,可用复相关系数R和决定系数R2来表示,R2等于因变量中可以由各自变量共同变化来解释的偏差平方和除以总偏差的平方和。R2=1时,表示y的全部偏差都可由回归方程中各自变量来解释,R2越大,y与x1,…,xn的线性关联越强,亦即误差消除比例越大。如R2=0.77,则R=0.877表示y的总偏差中77%可由这几个自变量的变异来解释。

在管理研究和社会科学研究中,多元回归分析是较为完善且普遍应用的描述多变量关联的技术。研究人员可用以在控制一个和多个控制变量的条件下考察一个自变量与因变量之间的关联,进而定量评价每个自变量变化对因变量产生的效应,并成为因果分析的依据。由于多元回归同时分析一组自变量对因变量的影响,研究人员可以对管理现象作出较完善的解释。

上述各种多变量描述统计技术,其差异主要在于对控制变量施加控制的方法,多变量关联表分析方法通过观测值归类来控制,而偏相关和多元回归分析通过调整变量值来控制。这两种方法各有优缺点,归类控制可以衍生出便于分析的关联表,但各类的样本数降低;调整控制可以较精确地描述自、因变量间的定量关系,但可能以偏概全,因为按控制变量的不同属性值加以控制时,自、因变量间的关系可能不同。

(三)因子分析

原则上说,多元回归分析可以采用任意个数的自变量来解释因变量的变化,自变量越多,对管理现象的解释能力越强,然而,随着自变量的数目增多,人们越难抓住问题的“要领”。一种病症可能和许多心理、生理因素相关,列出十几种直接或间接的影响因素并不困难,即使分析出这十几种变量和因变量之间的定量关系,也难以据此开出药方,只有诊断出关键病因才能对症下药,管理现象的考察和诊断,情况类似。因此,多变量数据分析中,在保证一定的对因变量变化解释能力的条件下,自变量的个数越少越好。通常希望找到降维的多元分析方法。

因子分析(factor analysis)是一类降维的相关分析技术,用来考察一组变量之间的协方差或相关系数结构,并用以解释这些变量与为数较少的因子(即不可观测的潜变量)之间的关联。

因子分析的结果体现在将原来的一组变量聚类并浓缩成较少的称为因子的新变量,而这些因子能涵盖原来变量的主要特征。

研究工作中,常常会遇到如何从很多数据中发现规律性,分析、把握样本或总体的主要特性的问题。例如,从含有p个数量指标(变量)的总体X中获得了n个样品X(1),X(2),…,X(n),其数据如表5-12所示,共有n×p个数据。

通过这些数据分析样本或总体的特性时,往往由于p个指标变量之间存在相关关系而使数据分析复杂化。但在很多情况下,上述p个指标变量的大部分特性能够由它们的k个(k比p小得多)所谓“综合指标”来概括。此时,问题就可以得到简化,可以按k个指标来把握样本或总体的特性。

表5-12 数据表

1904年,首创因子分析方法的斯皮尔曼(Charles Spearman)认为:智商测试中所采用的各种变量都和“总体智力因子”(general intelligence factor)有显著关联,同时,每项智商测试又涉及到某种技能(如数学),所以智商测试又和“专门因子”(special factor)相关,按此两因子的论点,智商(IQ)应等于受测者的总体因子(g)加上专门因子(s),g是先天的,遗传的,s因子则是学习的结果。

因子分析方法虽然在20世纪初就已提出,然而,由于分析步骤复杂费时,实用性差,只是在计算机及界面友好的统计软件出现以后才得到广泛的应用。现已经成为行为科学等领域中数据分析的有力工具。

1.分析步骤

因子分析的第一步是构造一个相关矩阵,在参数标准化情况下,此相关矩阵(即协方差矩阵)反映所研究变量间的关联性。

第二步是在相关矩阵基础上抽取新变量(即因子),提取因子是因子分析的主体内容,有多种提取方法。最常用的有主成分分析法(principal component analysis)和共同因子分析法(common factor analysis)。这里主要解释主成分分析法。

主成分分析法将一组变量转换为一组相互独立的因子,这些因子是原来变量的线性组合。

原来变量的总体特征主要反映在各变量的方差上。因此,主成分分析的目标便是寻求一组数目少并能反映总体方差且互不相关的因子,即原来变量的线性组合。对于有p个变量的总体X={x1,x2,…,xp},如找出方差最大的变量线性组合

则Z1称为主成分1。然后,在剔除主成分1引起的偏差后再找出与Z1线性无关的最优的变量线性组合,得出主成分2,按此方式继续提取主成分3,4等等,每次提取的主成分都是能最好地反映剔除已提取的因子影响以后的变量线性组合的方差。这个过程可以延续到各主成份能较好地反映出原总体变量的方差为止。不过,在实用过程中抽取出二三个为数不多的因子即可停止。

表5-13的因子矩阵反映出主成分分析的结果,表中数据均为假定。有A~F共六个变量,提取出两个因子,即主成分Ⅰ,Ⅱ。矩阵中的元素即为因子和变量之间的相关系数,在因子分析中此相关系数称作负荷(loadings),变量A和因子Ⅰ的负荷为f1=0.7,和因子Ⅱ之间的负荷为f2=-0.4。表中的“特征值”表示因子值的方差总和,如因子Ⅰ,由于它是各变量的线性组合,其特征值为0.72+0.62+0.62+0.52+0.62+0.62=2.18。此值除以变量数目即为该因子所能解释的总偏差比例,如因子Ⅰ能解释36.3%的总偏差,而两因子累计能解释的偏差的59.5%。h2为共性方差,表示每个变量的总偏差可由两因子来解释的部分,如变量A,共性方差为0.72+(-0.4)2=0.65,即变量A的偏差有65%可由因子Ⅰ,Ⅱ作统计上的解释。

表5-13 因子负荷矩阵

研究人员期望因子分析得出这样的结果,某个因子对某些变量来说是重负荷(即相关系数大),而另一个因子对另外一些变量重负荷,这样,分析结果就可以赋以明确的解释,减少因子和变量之间的关联的模糊性。例如表5-13中的变量D,其因子f1,f2的负荷量均为0.5,难以判定变量D应属于何种因子,变量E和F的情况亦类似。因此,因子分析中常用到因子轴的旋转(rotation)方法,简称转轴法,将因子负荷量的差距拉大,使因子间的区别更明确。

将因子f1,f2分别为横、纵轴作图,则表5-13因子负荷矩阵中的各项要素值都是此因子负荷量图(图5-9)中的一个点。表中各变量在f1和f2轴上的负荷量均较接近。为了对取出的因子作合理、明确的解释,可将因子轴进行顺时针或逆时针旋转,使各变量向量在两新轴上投影的方差差别尽量大。经过转轴的因子负荷矩阵中,每个变量只负荷于少数的因子上,而矩阵中0或接近于0的负荷系数越多越好。

转轴的方式有正交转轴法(orthogonal rotation)和斜交转轴法(obligue rotation)两种。正交转轴时,两因子轴维持垂直关系;斜交转轴时,两因子轴呈锐角或钝角关系,这较正交转轴更符合因子结构的实际情况,但各因子不再是相互独立。图5-9表示正交转轴的情况,经过转轴,变量A,B,C可明确归类于因子f1,而D,E,F则归类于因子f2

图5-9 因子负荷量图

2.示例[1]

某大学MBA项目主任分析学员第一学年的成绩单,感觉到各门功课的成绩之间有一定关联,从中可能区分出不同类型的学员。拟通过因子分析来检验这种设想,假定选择21份成绩单作为样本,采用SPSS软件来完成因子分析。

首先,算出10门课程成绩的相关系数矩阵,表5-14列出其中部分数据,数据表示各门课程之间零阶相关系数,如财务会计(V1)与管理会计(V2)关联较强,相关系数为0.56,而与生产管理(V7)负相关(-0.44)。

表5-14 课程成绩相关系数矩阵

输入此相关矩阵后,由SPSS软件进行因子分析计算,并得出因子负荷矩阵(表5-15)。按照计算机程序,所抽取的因子个数可以与变量数目一样多,但实用时要少得多,本例中有10个变量,抽取三个因子后就终止运算。

表5-15的共性方差表示每个变量的总偏差可由三个因子来解释的部分。可以看出,有些课程可解释的部分较大,如财务会计为73%,金融学为95%,而有些课程就较小,如行为科学占11%,这说明所抽取因子的解释能力还相当有限。

表5-15 因子负荷矩阵示例

表中的特征值用来度量各个因子的解释能力。例如因子1的特征值为

(0.41)2+(0.01)2+…+(0.25)2=1.83

此特征值除以变量数便是因子可以解释变量线性组合偏差的比例,三个因子可以解释各门课程总偏差的43%。

为了使因子的涵义更明确,使用方差最大的正交转轴法得出表5-16的结果,由此表看出,每个因子包含几个负荷系数较大的课程并归类为一组(表5-17),这组课程与该因子正(负)相关性强。

最后,对因子分析结果作出解释。解释这个环节很重要,但在相当程度上要依靠主观判断。本例中,可以按表5-17的课程归类将学生分成三类,一类是专长于会计学科的,一类是专长于金融学的,还有是市场学的。当然还可作其他解释,如将各因子理解为定量分析的难度等。

表5-16 转轴后的因子负荷矩阵示例

表5-17 课程归类

结果的解释还受到其他因素的影响。包括:①样本大小,如果有更多的新样本,所得出的相关矩阵和负荷矩阵便会不同;②抽取因子的个数,本例中,如抽取五个而不是三个因子,可能显示的是另外一种模式;③情境的影响,某门课程可能由于教师的教学方式或不同要求而影响成绩,并非课程特点引起成绩差异。可见,因子分析虽是很有用的多变量数据分析工具,但使用中,特别是解释结果时必须特别慎重。

3.确认型和探索型因子分析

前面提到,抽取因子的方法主要有主成分分析和公共因子分析两种:主成分分析是将变量x1,x2,…,xp进行线性组合,成为相互独立的一组新变量(因子),并使新变量具有最大的偏差解释能力;公共因子分析(有时简称为因子分析)是从一组变量中找出其隐含的共同因子。

从统计技术角度说,两种方法抽取因子的计算过程有所不同。主成分分析时,变量的所有方差都要用到:由相关矩阵得到的特征值正是因子的方差,而标准化的特征向量正是因子在x1,x2,…,xp上的负荷系数,在相关矩阵中,主对角线的各元素数值仍为1。公共因子分析只考虑变量中的共性部分。在变量x1,x2,…,xp中,每个变量xi分为两部分,即

img133

其中img134为变量xi与其他变量相同的共性部分,设有m个因子(即公共因子f1,f2,…,fm),则img135可表示为

img136

si为变量xi与其他变量不同的独立部分,它由独立因子ei所引起,可表示为

si=biei

这样,每个变量与m个公共因子和独立因子的关系便可表示为:

xi=ai1f1+ai2f2+…+aimfm+biei (i=1,…,p)

公共因子分析只考虑共同因子部分,对相关矩阵处理便有所不同。主对角线原来均为1,它包含了变量偏差的各种可能来源,现在,要扣除总偏差中独立因子所带来的偏差,故相关矩阵主对角线的数值1要由各变量

两种抽取因子的方法不同引发了两者功能的差异。公共因子分析法用来挖掘潜在的影响所有原来变量的新变量,研究者事先并无任何关于变量和因子间关联的假设,重点放在发现关联(theory-generating)。从功能角度看,共同因子分析法属于探索型因子分析(exploratory factor analysis)。主成分因子分析,由于因子反映变量间最优线性组合,有可能事先提出假设,设定一组变量与某个因子或因子与因子之间存在强关联,然后去检验它们之间的负荷系数,所以,主成分因子分析用于确认型因子分析(confirmatory factor analysis)。

(四)原因事件的辨识

复相关分析、多元回归分析或因子分析,可以辨别变量间的关联情况,但并不能断定两者是否是因果关系,最多是能够为因果关系判断提供依据。心理学和行为决策中的“归因理论”(attributed theory)专门研究不确定条件下的因果判断。从第二章的华莱士模型来看,因果判断属于机理解释的内容。这里简要叙述辨识原因事件的几个要点。

1.事件的变异性

自变量和因变量都是在一定的情境(context)之下产生的。如果某个变量在某种情境下必然出现,则成为原因事件的可能性甚少。以“生”与“死”的关系为例,虽然生是死的必要和充分条件,但现实生活中人们不可能把生说成是死的原因,总是在隐含的“生”这个必然前提下来推断死亡的原因。换言之,出生在任何原因背景下都显得正常,并不使人们有何差异之感,不把它作为原因事件看待。所以,在进行细分分析前,“变异性”准则可帮助研究者辨析何者应作为原因事件的自变量,何者作为控制变量。至于变异性的辨析,要审视事件发生的情境,房屋窗户玻璃破碎人们总会归因于硬物撞击,而玻璃生产厂出厂前的产品检验中,出现玻璃破碎时,硬物撞击却不是必然条件,这时,玻璃质量弊病成为变异事件。

又如判断火灾原因,可能是由于电器短路引起,然而,周围有易燃品、无有效的火灾报警灭火系统才会形成火灾。通常把变异性最明显的因素作为原因事件,即把电器短路视为火灾原因,而易燃品、报警灭火系统等看作必要条件。

2.时序性

如果存在因果关系,自变量必须发生在因变量出现反应之前。然而事件发生的时序判断并非易事,研究者获取数据方式常会引起一些问题。原则上说,实证研究属于序贯性研究,跟踪事件发生的全过程,事件的时序性应很清楚,问题在于许多研究方法如问卷法、访谈法、现存统计资料分析法等,自、因变量的数据都是同时获得的,难以分辨它们之间的时间顺序。例如,通过经济效益指标来考核企业的绩效这并没有错,但凭这些指标的好坏来推断该企业管理者管理有方或管理不善,将经济效益指标看成是“自变量”,管理者的管理水平是“因变量”,就违反了时序性原则。不能将时序在后的事件作为原因事件。经济效益指标是后续出现的因变量,管理水平是可能原因之一,不能完全用因变量来推断自变量。实践中,这种时序不分的思考常误导人们的行为,如为了显示自己的能力以求得提升而虚报谎报效绩指标等。

3.呼应性

因果事件在空间上的呼应程度也是因果判断中的一个准则。所谓呼应性指与自变量、因变量关联的事件发生在特定的空间范围之内。例如,学校范围内成立的因果关系在企业范围内不一定适用,深圳企业发生的事件不能用来推断西安企业出现的后果。当然,有些空间范围不同的事件也可能有因果联系,但要找出有证据的、逻辑推理解释得通的事件关联的因果链。如前述太阳黑子和经营周期的因果关联问题,当时从空间呼应性看不能成立,但随着研究深入,这个因果假设可以用因果链来解释:太阳黑子影响气候,气候变化直接影响农作物生长和农产品利润,进而使农产品和其他产品价格产生波动。

因果关系和相关关系既有联系又有区别。这主要体现在:自变量和因变量之间如存在因果关系,必然存在相关关系,但存在相关关系,并非一定是因果关系;因果关系中自变量必然发生在因变量关系之前,而相关关系并无此要求;因果关系分析要排除各种干预、掩盖、抑制效应的影响,才能辨析自变量对因变量产生的影响。

有些论文冠以“机理”研究,机理研究意味着要把事情的前因、后果说清楚,发现、描述和论证两变量间的因果链,这是机理研究的必要内容,如果缺乏变量间因果分析(causal analysis)就不能称为机理研究。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈