首页 百科知识 回归分析的基本思想

回归分析的基本思想

时间:2022-03-18 百科知识 版权反馈
【摘要】:相关关系的常见形式可表示为y=f(x)+ξ,其中f(x)是常见的函数形式,如一次函数、反比例函数、指数函数、对数函数等,ξ是随机变量.由于随机变量ξ的存在,于是对于每一个值x0,对应的值f(x0)+ξ无法唯一确定,但是我们知道这些值必定是在确定的值f(x0)的附近摆动.如果反复试验,ξ的平均值应为零.因此f(x0)+ξ的平均值为f(x0).也就是说,f(x)+ξ的值应向f(x)回归.如果能确定y=
回归直线_统计中的智慧

相关关系的常见形式可表示为y=f(x)+ξ,其中f(x)是常见的函数形式,如一次函数、反比例函数、指数函数、对数函数等,ξ是随机变量.由于随机变量ξ的存在,于是对于每一个值x0,对应的值f(x0)+ξ无法唯一确定,但是我们知道这些值必定是在确定的值f(x0)的附近摆动.如果反复试验,ξ的平均值应为零.因此f(x0)+ξ的平均值为f(x0).也就是说,f(x)+ξ的值应向f(x)回归.如果能确定y=f(x)+ξ中f(x)的解析式,就能从总体上把握变量y与x的关系.这就是回归分析的基本思想.

回归分析中最基本的是一元线性回归,也就是工程技术上和科研中经常遇到的配直线问题.我们先看一个例子:

例1 某种合成纤维的强度与其拉伸倍数之间有一定关系.表23.1所示是测量24个纤维样品的强度y与相应的拉伸倍数x的数据记录.试求出这两个量之间的关系.

表23.1 某种合成纤维的强度与拉伸倍数之关系

续 表

由表23.1可见,强度y有随拉伸倍数x的增加而增加的变化趋势,但是它们之间的关系是不确定的.例如,第5号试验与第6号试验、第7号试验与第8号试验、第9号试验与第10号试验、第19号试验与第20号试验,虽然拉伸倍数x相同,但是对应的强度y却不相同.而第4号与第6号试验、第10号与第12号试验等,虽然强度y相同,但是对应的拉伸倍数x却不相同.可见强度y与拉伸倍数x之间不存在通常的函数关系.

为了探索变量x与y之间的内在联系,根据表23.1中的24对数据(xi,yi),i=1,2,3,…,24,在平面直角坐标系中描出对应的24个点,见图23.1.这张图称为散点图.图中的这些点看起来比较散乱,但是大致分布在某条直线的附近.因此,强度y与拉伸倍数x之间的关系可以表示为

图23.1 联系y与x的散点图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈