在一元线性回归分析中,如何确定一条直线来代表各个相关点的变动趋势,即配上一条最适合的直线,足以代表全部相关点直线的趋向,这是建立回归方程最为关键的问题。图4-7所示的相关图显示,货运量与物流总产值之间存在高度的正线性相关关系,因此可用一元线性回归直线进行拟合。
假定X与Y是线性相关,则有:
它的假定是:ε~N(0,σ2),且cos(εi,εj)=0(当i≠j时)。为测定X、Y变动的一般规律性,两边取期望,得到理论回归方程:
在回归分析中,因变量Y是一个随机变量,其期望值一般是无法确知的,因此式(4-36)中的参数α与β的真值一般是无法求得的。为此,只能通过观察值得到参数α与β的估计值a和b,从而式(4-36)可转化为:
式(4-37)中的、a和b分别是E(Y)、α和β的估计值,x为自变量X的观察值。一般称式(4-36)为总体回归方程;式(4-37)为样本回归方程或经验回归方程,作为总体回归方程的估计式。
现在的问题是如何确定式(4-37)中的a和b的值,使得到的样本回归直线与观察值拟合。设由式(4-37)确定的回归值与实际观察值yi的误差平方和为Q,则Q的表达式为:
式(4-38)中,yi和xi是已知的观察值,是回归值,n是样本容量。显然,误差平方和Q刻画了散点同回归直线的紧密程度。采用最小二乘法可以在所有可能的直线中找到使误差平方和Q达到最小的回归直线。
最小二乘法是根据微分极值定理,对Q求关于a和b的偏导数并令其为0,即:
经整理后可得:
上式一般称为标准方程组或正规方程组。解该式可得:
同时,可记,,则有:
也即:
因此,回归直线是一条经过点,斜率为b的直线。若记:
由此可得:
由于lxx>0,故参数b(称为样本回归系数)的符号取决于lxy。显然,当b>0时,y随x增大而增大,表明y与x的变化相同;当b<0时,y随x增大而变小,表明y与x的变化相反。
由于,因此,,这是相关系数r与样本回归系数b之间的关系,显然r与b的符号是一致的。
【例4-14】
根据表4-16中的数据,可求解货运量与物流总产值的回归方程。
故回归方程为:
式中,a=6.34亿元为估计的固定物流总产值;b=17.36表示当货运量每增加每增加1百万吨公里时,物流总产值平均增加17.36亿元。若2011年该地区的货运量为6.6百万吨,则可预测:
2014年物流总产值=6.34+17.36×6.6=120.92(亿元)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。