首页 理论教育 灾则粮食总产量回归为万吨

灾则粮食总产量回归为万吨

时间:2022-03-11 理论教育 版权反馈
【摘要】:表11.5          某县粮食产量与气候、播种面积数据若采用分段回归模型估计。
变量回归_社会统计学

第三节 虚拟(哑)变量回归

在实际社会问题研究或进行回归模型估计中,有时会遇到自变量是属性变量或定序变量,如性别、职业、正常年份与非正常年份、改革前与改革后等属性变量,如文化程度等定序变量。建立回归模型时,常需要考虑这些变量对因变量的影响。

一、基本原理

在回归分析中,当自变量是属性变量时,可先进行数量化处理。处理的方法是引入虚拟变量(0-1型变量),即当某一属性出现时,虚拟变量取值为1,不出现时,虚拟变量取值为0。虚拟变量又称0-1型变量、哑(伪)变量(Dummy Variable)。属性变量量化处理,可有下列两种情形。

(1)定性变量只取两类(k=2)时,如性别、改革前与改革后、大与小、高低等品质变量,这时可引入一个0-1型变量。例如,y为粮食产量,x为施肥量,D为气候变量,时间为i,可令:D=1表示正常年份,D=0表示受灾年份。粮食产量的回归模型为:yi01xi2Dii

(2)定序变量取值有多类时,可引入k-1个0-1型变量。例如,考虑商品销售的地区影响,因素分为东、南、西、北4种情形,若令x1=1表示东方,x1=0表示其他方位;x2=1表示南方,x2=0表示其他方位;同理可定义x3表示西方,x4表示北方。但4个自变量。x1、x2、x3、x4之和恒等于1,这样会构成多重共线性。解决的办法是只需去掉一个变量,一般去掉首个或最后一个变量,如去掉x4,只保留x1、x2、x3,当3个变量全为0时,表示x4=1。

以上两种方法计算的结果并不一样,一般以使用第二种方法的案例比较多。

二、个案分析

[例11.5]为研究肥胖症,某医院收集了10名男子的体重(公斤,Y)、身高(厘米,X1)和年龄(岁,X2)资料如表11.3。用该资料可建立二元线性回归方程:img527=-102.038+0.957X1+0.269X2。

由于F=8.883>F(2,7,0.05)=5.59,因此,可以认为体重与身高和年龄之间存在着显著性线性相关关系。回归平方和、总平方和分别为538、750,即X1、X2对Y的回归解释了64%的总平方和。

表11.3          体重、身高和年龄的分布关系

img528

有时因变量与自变量并不是呈现线性关系的,当样本较大时,可以引入哑变量(Dummy Variable)。例如可以将身高(X2)用伪变量X3、X4、X5表示如下:

img529

于是,数据就转换为表11.4。

表11.4          哑变量多元线性回归方程基本数据

img530

续上表

img531

若将X2、X3、X4、X5作为自变量,则可建立含有哑变量的多元线性回归方程:

img532

利用上表中的资料,用SPSS软件就可得到如下多元线性回归方程:

img533

[例11.6]某县粮食总产量与气候、播种面积数据如表11.5所示,在耕作技术和粮食品种相对稳定的条件下,气候和播种面积对粮食总产量都有影响,假定它们之间对粮食总产量有交互作用效应,可建立如下联合回归模型:yi01xi2Dii

在以上含定性自变量的回归分析中,若假定虚拟变量与数量型变量有交互作用效应,并且虚拟变量取值为1和取值为0的两个回归方程有相同的斜率和相同的误差项方差,则可建立联合回归模型,采用最小二乘法进行模型参数估计,并进行模型检验。用最小二乘法估计的二元线形联合回归模型如下:

y=-2.661+3.164D+5.612X

 (-0.512)(6.456)(5.367)

R=0.962,F=56.369,Sy=0.7749

模型各项检验具有显著性。估计结果表明气候与播种面积对粮食总产量都有显著的影响,其中正常年份的粮食总产量比受灾年份平均多3.164万吨,播种面积每增加1万公顷,粮食总产量可增加5.612万吨。如2006年播种面积为5.6万公顷,年份正常则粮食总产量可达到31.93万吨,若受灾则粮食总产量为28.77万吨。

表11.5          某县粮食产量与气候、播种面积数据

img534

若采用分段回归模型估计。在含定性自变量的回归分析中,虚拟变量取值为1与取值为0时,对因变量的影响往往截然不同,亦即虚拟变量取值为1和取值为0的两个回归方程有不相同的斜率和不同的误差项方差,采用分段回归估计模型的参数,对D=1和D=0分别建立回归方程,并进行模型检验,结果与前文并不一致,虽然两个回归方程的各项检验具有显著性。所以,虚拟变量是一种数据分类的技巧,它根据事物的性质或属性把一个样本分为不同的子类,因此,在含定性自变量的回归分析中,如果样本数量比较大,采用分段回归估计模型参数的个案比较多。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈