首页 理论教育 怎样判断线性回归方程的准确度

怎样判断线性回归方程的准确度

时间:2022-02-12 理论教育 版权反馈
【摘要】:标准曲线通常是一条直线, 但由于实验误差等因素的存在, 各数据点对直线往往有所偏离, 用手工做图法所做的标准曲线误差较大, 而用回归分析法可求出对各数据点误差最小的直线, 即回归直线, 再由回归直线反估待测物质的含量及其置信区间, 结果较准确, 还可检验测定结果的线性相关关系和回归直线拟合的好坏。本书只介绍常用的一元线性回归分析法。

电位分析、 光度分析和分离分析等分析方法中, 往往将被测物质的含量转换成与之成直线关系的光电信号, 使用标准曲线法来确定待测物质的含量。 例如, 在光度分析中, 先测量一系列不同浓度的标样溶液的吸光度, 做出吸光度与浓度的关系曲线, 即标准曲线, 如图8-3所示, 然后测定样品溶液的吸光度, 在标准曲线上查出样品溶液中待测物质的浓度,从而求得样品中待测物质的含量。

图8-3 对实验数据做标准曲线示意

标准曲线通常是一条直线, 但由于实验误差等因素的存在, 各数据点对直线往往有所偏离, 用手工做图法所做的标准曲线误差较大, 而用回归分析法可求出对各数据点误差最小的直线, 即回归直线, 再由回归直线反估待测物质的含量及其置信区间, 结果较准确, 还可检验测定结果的线性相关关系和回归直线拟合的好坏。

回归分析法是指据实验数据建立两个或两个以上变量的数量关系(回归方程)并据此由一个或几个变量的值去估计另一个变量的值的数理统计方法。 本书只介绍常用的一元线性回归分析法。 下面介绍回归直线方程。

若测量n个数据点(yi,xi),它们之间存在线性相关关系,其回归直线方程见式(8-3):

y =a+bx (8-3)

式中, y为因变量(如吸光度、 电极电位和峰面积等分析信号); x为自变量(如标准溶液的浓度等可以严格控制或精确测量的变量); a为回归直线的截距(或称为回归常数, 其与系统误差的大小有关); b为回归直线的斜率(或称回归系数, 其与测定方法的灵敏度有关)。 例如, 在用分光光度法制备标准曲线时, 溶液的吸光度与吸光物质的浓度成正比, 该线性方程的截距a、 斜率b可通过对一组实验数据进行拟合得到(图8-3)。

回归直线的总误差为各数据点(yi,xi)与回归直线的离差的平方和(残余差方和),用Q表示, 见式(8-4):

Q=∑d2i=∑(yi-y)2=∑(yi-a-bxi2(8-4)

回归分析常用最小二乘法, 即回归直线是所有直线中离差平方和最小的一条直线, 因此回归直线的截距a和斜率b应使Q为极小值。 根据微积分求极值的原理, Q为极小值的条件为它对a和b的偏微分为零, 见式(8-5)及式(8-6):

由此可得式(8-7)和式(8-8):

式中, x和y分别为各数据点x和y的平均值, 见式(8-9)和式(8-10):

显然求出a、 b即可求得回归直线方程y=a+bx。

实验误差和线性相关关系对回归直线的影响可用残余标准差Sf来衡量,见式(8-11):

残余标准差越小, 拟合的回归直线越好。

两个变量之间是否存在线性相关关系可用相关系数r来检验, 见式(8-12)。 相关系数定义为回归数据点xi标准偏差的b倍与yi的标准偏差之比值(b为回归直线的斜率)。

r2=2(或r=±1)时,两个变量完全线性相关,所有回归数据点都在回归直线上,无实验误差;r2=0时,两个变量毫无线性相关关系;0<r2<1时,两个变量有一定的线性关系。有意义的线性相关关系的临界值见表8-3。r2越接近1,线性关系越好。

表8-3 相关系数临界值 (r, f)

注: α为显著性水准; n-2为自由度f。

对拟合直线回归还可以得到以下参数:残余标准差:

截距a的标准差:

斜率b的标准差:

除了用相关系数检验方程的优劣之外, 还可以用F检验法[式(8-16)]:

计算得到的F值与F检验表(本书略)中的临界值进行比较, 进行F检验。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈