首页 理论教育 曲线回归模型分析

曲线回归模型分析

时间:2022-03-11 理论教育 版权反馈
【摘要】:但是为了评价非线性回归模型的拟合程度及其估计误差的大小,可计算下列评价指标。
曲线回归模型分析_社会统计学

第二节 曲线回归模型分析

在现实生活中各种现象是十分复杂的,在很多情况下,当一个变量增大时另一个变量并非呈稳定增加或减少状态,那么应该用什么样的曲线进行拟合,这是一个非常复杂的问题。

曲线拟合是指选定某一用方程表达的曲线,使得实际数据与理论数据之间差异尽可能地小,如果曲线选择得好,那么可以揭示因变量与自变量的内在关系,并对今后工作有一定指导意义。在曲线拟合中,需要解决两个问题,选用哪一种理论模型,即哪一种方程式来拟合所观测到的实际数据;当模型确定以后,如何选择合适的参数,使得理论数据与实际数据的差异为最小。

一、曲线回归的计算原理

变量之间的关系并非都是直线关系,应该根据不同的对象提出不同的研究方法。基本的研究方法是:首先,做散点图以观察曲线的形状。若XY坐标轴相关点呈团状分布,则表示两变量没有任何关系。如果两个变量有关系,一种是最简单的直线线性关系,另一种为非线性关系。非线性关系又分两种:一种是本质线性关系(Intrinsically Linear Models)或拟线性关系,可转换成线性关系,用最小二乘法的方法求出相关系数;另一种是本质非线性关系(Intrinsically Nonlinear Models)不可转换成线性关系,仅能用迭代方法,或分段平均值方法完成。

其次,应该根据专业知识进行分析,或从长期积累的数据中找出变量之间的函数类型。如在一定的条件下,农作物的产量与每亩株数(密度)的关系往往成为抛物线。当密度较低时,产量随密度的提高而迅速增加,以后逐渐缓慢增加,当密度增加到一定程度后,再增加密度,产量反而下降。由此可知两者之间的关系可能用抛物线比较合适。又如在生物试验中,细菌的培养往往是由少到多越来越快成倍地增长,每一时刻的细菌总量与时间有指数的关系。但在更多的情况下不知道函数的形式,就要根据实验数据结合理论分析和做散点图等方法进行模拟试验,选择恰当的曲线和参数拟合这些数据。

表11.2提供了下列11种形式的曲线回归方程:

表11.2          拟线性模型

img521

其中:x、m为自变量;y为因变量;b0、b1、……bn回归系数;ln(x)为x的自然对数;e为自然对数的底;u为logistic模型的上限值;c、d为常数。下文仅以一例说明其具体的应用。

由上述可见,直线方程模型是数据拟合中用得最多的一类。线性方程表明因变量y值按照某一定比例稳定地增加或减少。指数曲线y=abx中y值不是按固定值增加或减少,但是每次改变量变化的比例却保持不变。如果b是大于1的正数,那么y就显示上升趋势,并且改变量以固定百分比增加,b若是小于1的正数,y值的趋势是下降,并且改变量以固定百分比减少。

如果数据是在一个较长时期内得到的,变量不可能无限增长,时间数列就很难显示出固定的改变量或固定的变化比。因此有人用修改指数曲线y=abx+c来拟合,在修改指数曲线所描述的趋势中,增量按一个固定的百分数下降,而且曲线也渐近于一个叫做渐近线的上限。

二、曲线的选择

为了拟合各种不同类型的曲线。现将选择曲线的一般准则说明如下:

(1)如果因变量的一阶差分(Yi-Yi-1)接近常数,就用直线拟合。即当自变量做等差增加或减少时,因变量也随之做等差增加或减少,用线性方程;

(2)如果二阶差分(Yi-Yi-1)-(Yi-1-Yi-2)接近常数,就用二次抛物线拟合;

(3)如果一阶差分倾向于按固定的百分比Yi/Yi-1减少,就用修改指数曲线,即当自变量做等差增加或减少时,因变量也随之做等比增加或减少,用复合(指数)曲性方程;

(4)如果对数的一阶差分接近常数,就拟合指数函数;

(5)如果对数的二阶差分接近常数,就拟合指数抛物线;

(6)若倒数的一阶差分几乎按固定的百分比变化,就使用逻辑斯蒂曲线。

选用哪一类回归方程才能最好地表示出一种X、Y变量的曲线关系,往往不是一个简单的问题,在可能的方程之间,以实际吻合程度而论,也许是片面的。因此,在对曲线类型选择上,还应该考虑变量之间的内在关系、置信区间与显著性检验效果等。

三、非线性回归模型的评价

非线性回归模型一般不能进行有关的统计检验,因为许多统计检验都是建立在线性统计模型基础之上的。但是为了评价非线性回归模型的拟合程度及其估计误差的大小,可计算下列评价指标。

(1)可决系数img522

(2)估计标准误差img523

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈