首页 理论教育 某小化工厂产品收率的回归分析

某小化工厂产品收率的回归分析

时间:2022-02-13 理论教育 版权反馈
【摘要】:第 2行末标“**”号,表其标准偏差s最小,即该模型当前最优。程序规定,当原始数据量不多于实际回归元数5个时,将给出“数据不足”的信息并停止该模型的运行。前已说明,回归分析中数据量不能过少,否则复杂模型资源可能不能被利用,本例即如此,最好达到按模型3计每个回归变量有近3组数据。用这样的方程拟合过程数据无疑十分理想。此也说明多项式回归有强大拟合能力,可能得到拟合很好的回归方程。

上表每行数据表示一个模型的特征运行结果。首列为模型号;“M0”列为该模型启运时的初始回归元数;“MM”列为运行终了时模型含有的全部显著变量个数;“R”为建模运行的总轮次数,其后为所得回归方程的s﹑z﹑h值。第 2行末标“**”号,表其标准偏差s最小,即该模型当前最优。模型3﹑6﹑9﹑10后面有“Data isn't enough !”,意为“数据不足!”,即这些模型因数据量不足回归未进行。程序规定,当原始数据量不多于实际回归元数5个时,将给出“数据不足”的信息并停止该模型的运行。

所有16个模型的运行都使用相同观测数据,表1-7虽无更多内容,但保证每个模型的回归都已进行到最后状态,所得回归方程所含变量全都显著。接着按F5键,程序将自动按“**” 号所指模型按手动选择模型法再回归一次,最终,回归者会得到最优回归方程的全部信息。程序编制中,对再运行的输出方式做了新的安排,目的是只注意取得最后结果,此时变量筛选的中间过程皆一闪而过,一停机即输出最优模型的相关信息。输出的顺序是,先输出最优模型对原始数据的拟合状况表(一屏屏的,需按F4键观看),再输出最优模型及其显著性检验状况表,并最后输出“END”和停机。

如出于某种考虑不打算采用最优模型(此并非合理决策),可中断运行,参考16 个模型的总体运行结果表,按手选模型方法重新选定模型运行,此时在暂停点再开机应使用“Start”按钮指令。本例模型自选取得的模型为模型2,说明16个模型中只有该模型最优,这样的结论令回归者放心,没有悬念。

本例的特别情形是数据过少。前已说明,回归分析中数据量不能过少,否则复杂模型资源可能不能被利用,本例即如此,最好达到按模型3计每个回归变量有近3组数据。本例为4个决策变量,按模型3计的初始回归元数为14元,最好能有约40组数据左右,而原始数据只有13组,比其初始回归元数还少,直接使用模型自选的回归操作,许多复杂模型未被试用(见表1-7)。从使用模型2的回归看,所得回归方程的相对偏差仅z=1.09,说明原始数据有高精度,决定将全部观测数据加倍,做加权回归分析,争取得到高精度回归结果。由此,数据由13组变成26组,虽仍不足,但较前好多了。数据的加倍操作,可将本题数据块首行中的数字“13””改为“26”,再用编辑指令,将数据块中的观测数据整块复制一次。

本例数据经加倍,采用自动优选模型法运行(Start → 回车),经大约5秒钟最优模型即选定,输出表1-8,继续运行后得表1-9和表1-10。

由三张表看到,本例经数据加倍和模型自动优选运行,取得了拟合极好的回归方程,模型所含全部回归变量都高度显著,误差数据s﹑z甚小,观测值与回归值(或模型预报值)之差近于零,最大偏差也只有0.0146,差不多与理论关系相当。用这样的方程拟合过程数据无疑十分理想。此也说明多项式回归有强大拟合能力,可能得到拟合很好的回归方程。此外,比较本例16个模型所得s值看,除少数模型外,相互间有较大差别,说明使用不同模型类型进行的数据拟合,有可能得到效果相差很大的结果,虽然表中这些方程所含全部变量都显著。过去,此一情形常不被人们所注意,误以为方程显著和其中变量全都显著就是好方程了。

表1-8 例1-1数据加倍后模型自动选优运行总体结果

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈