回归分析的一般介绍

时间：2022-02-13 理论教育版权反馈

【摘要】：回归分析法是过程建模的最重要方法。这样做一般通过如下方式达到：将过程模型转到计算机上，给出运行必须满足的条件范围要求，进行过程的模拟运行计算，俗称“过程模拟”。一般自然发生的非受控过程多如此。回归分析主要应用领域为受控过程。当然，即使用全回归分析法，因观测数据总存在有较大误差的可能，也不能指望每个所得回归模型对过程本身都精细准确，但应随时注意肯定出过程的精细准确模型，这有很大意义。

凡机理不清的过程，欲了解其变化规律，需做试验和取得观测数据，从分析过程开始与终了的数据出发，先假定一个过程规律，即写出具有一定变量结构关系的方程式，随后按误差最小原则，经数字计算与分析，求定变量的系数，建立出过程运行指标与变量取值关系的经验型数学方程式或数学模型，称过程的回归分析(属黑箱原理)。因过程规律事前不知，可不断假设多种规律，求定多个过程模型，比较择优，取数据拟合最优（误差最小）的模型作过程的实际模型。回归分析法是过程建模的最重要方法。

回归模型固然可帮助人们推定过程机理，但其根本用途是帮助人们实现过程某种操控指标/目标的最优化运行。这样做一般通过如下方式达到：将过程模型转到计算机上，给出运行必须满足的条件范围要求，进行过程的模拟运行计算，俗称“过程模拟”。因任给一组运行参数（变量值），会通过模型计算取得相应的过程指标值，又因模拟皆使用某种优化方法（详第三、四章），使模拟渐趋过程最优点和最后取得该点，此点包含过程目标的最优值及其相应的一组运行参数值。最后将搜索所得结果赋予生产实践，过程即实现最优运行，例如或达到生产利润最高，或产品质量最好，或原材料消耗最少等竞争取胜的目的要求。当前也称此为“过程优化分析”。

过程模拟结果是根据过程模型取得的精确计算结果，具有严格、科学特性，与一般“估计”、“推定”不同，只有模型准确可靠，即模型预报数据误差逼近试验观测数据误差，且实际误差也很小，才真正有意义，因为优化分析所取得的过程效益增加通常多在3%左右。不能期望观测数据没有误差，但应通过仔细工作使所得模型误差尽量小和期望在回归中尽量取得过程的真实模型或接近真实的模型，这是做回归工作必须遵循的刚性原则，是回归者的光荣职责！

过程模型应准确到何种程度！根据当前计算机已处甚高水平的现实，笔者以为，对计算机操控过程，模型的预测结果应有约近99%的准确程度，即预测数据的相对误差大约只有1%左右，才是好模型。此应作回归者不懈努力的目标。对如何判定模型的精确性与准确性等问题，后面会给出具体的具有可操作性的分析判定方法。当然，也必须理解另一类情况，有些过程不属可控过程，如统计某种疾病的发病率与人群年龄关系的回归问题等，通常观测数据都有很大误差，不可能得到准确模型，也是没有法子的。一般自然发生的非受控过程多如此。回归分析主要应用领域为受控过程。

此前做回归，模型选定无所依据，又有复杂计算，难学、难用，结果的可靠性甚难保证，普及性甚差，客观上有“高技术”地位，参与工作的人很少，大量该有模型的过程搞不出模型，该工作实际处于冷冷清清局面。实践证明，能否求得并肯定出大批过程的精确模型，是回归工作生死存亡的关键课题，应予严重注意。

笔者试提出一个新的回归操作方法——“全回归分析法”（第一版），该法仍使用最小二乘法与方差分析法，并无新的理论建树，但做了较合理安排。构建了包含从模型选择到变量筛选等全部操作内容的“一键搞定”的总包回归应用程序，建任何模型只需向程序打入观测数据，分分秒秒间即可获得过程模型，且通常为过程的精确模型，工作中仅希望观测数据尽量准确些，无手工计算，没有什么限制。模型精确性和准确性可按给出的有关参数立即判定。回归建模开机一次即成，人人可学可用，十分简单方便，甚易普及。现推出供试用与获得批评。

当然，即使用全回归分析法，因观测数据总存在有较大误差的可能，也不能指望每个所得回归模型对过程本身都精细准确，但应随时注意肯定出过程的精细准确模型，这有很大意义。由计算机操控过程取得的数据，通常都准确可靠，都有希望取得精准模型。

本章不介绍原理性回归计算知识，只介绍应用程序编制原理与其调用操作的有关规定。欲了解基础性回归知识，可去读附录三。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈