数据拟合与插值

时间：2023-02-12 理论教育版权反馈

【摘要】：在每年的全国大学生数学建模竞赛中经常会涉及预测类数学建模问题.预测问题在现实世界中也是经常遇见的，是一类经典的实际问题，它的一般要求是分析过去已有数据的内在趋势，并据此对未来的数据进行预测，以便指导以后的工作或对问题作进一步的研究.因为其重要性，本书将预测类专题作为第3章进行介绍.许多数学建模初学者可能认为预测是一门非常高深的学问，其实预测类数学问题并不难解决，本章将为大家撩开预测神秘的面纱.本章

第3章　预测类数学模型

在每年的全国大学生数学建模竞赛中经常会涉及预测类数学建模问题.预测问题在现实世界中也是经常遇见的，是一类经典的实际问题，它的一般要求是分析过去已有数据的内在趋势，并据此对未来的数据进行预测，以便指导以后的工作或对问题作进一步的研究.因为其重要性，本书将预测类专题作为第3章进行介绍.许多数学建模初学者可能认为预测是一门非常高深的学问，其实预测类数学问题并不难解决，本章将为大家撩开预测神秘的面纱.本章展现了几种不同的预测方法：多项式拟合、非多项式拟合、Leslie结构矩阵和灰色预测等，旨在帮助大家了解不同背景下不同预测方法的应用.

在解决实际问题的生产（或工程）实践和科学实验过程中，通常需要通过研究某些变量之间的函数关系来帮助大家认识事物的内在规律和本质属性，而这些变量之间的未知函数关系又常常隐含在从试验、观测得到的某组数据之中.因此，能否根据某组试验观测数据找到变量与变量之间相对准确的函数关系就成为解决实际问题的关键.

拟合与插值是函数逼近或者数值逼近的重要组成部分.在数学建模的某些问题中，通常要处理由实验或测量得到的大批量的数据，处理这些数据的目的是为进一步研究该问题提供数学手段.这些数据有时是某一类已知规律（函数）的测试数据，有时是某个未知函数的离散数据，插值与数据拟合就是通过这些已知数据去确定某类函数的参数或寻找某个近似函数，使所得的函数与已知数据具有较高的拟合精确度，并且能够使用数学的工具分析数据所反映对象的性质.数据拟合与数据插值的不同之处，我们通过下面一个实例来进行说明.

例3-1　污染预测问题——CUMCM2005

长江是我国第一、世界第三大河流，长江水质的污染程度日趋严重，已引起了相关政府部门和专家们的高度重视.2004年10月，由全国政协与中国发展研究院联合组成“保护长江万里行”考查团，从长江上游宜宾到下游上海，对沿线21个重点城市做了实地考查，揭示了一幅长江污染的真实画面，其污染程度让人触目惊心.假如不采取更有效的治理措施，依照过去10年的主要统计数据，对长江未来水质污染的发展趋势做出预测分析，比如研究未来10年的情况.如表3-1为1995—2004年长江的排污量，根据以上数据，预测2005—2014年长江的排污量.

表3-1　1995—2004年长江排污量

针对1995—2004年长江排污量的数据，分别采用数据拟合和数据插值两种方法建立模型，预测2005年以后的排污量趋势，如图3-1所示.其中实线表示数据拟合的结果，虚线表示数据插值的结果.

　图3-1　长江污染量预测图

从图3-1中，可以清楚地发现数据拟合与数据插值之间的区别.

1.插值是通过每个测试数据点，得到测试函数，这是基本的插值方式.插值是指已知某函数在若干离散点上的函数值或者导数信息，通过求解该待定形式的插值函数以及待定系数，使得该函数在给定离散点上满足约束（函数过该点）.插值函数又叫做基函数，如果该基函数定义在整个定义域上，叫做全域基，否则叫做分域基.常用的插值（根据待定函数的形式）主要有多项式插值和样条插值.

2.拟合是以残差平方和最小为原则，得到的测试函数不一定经过所有的测试数据点.简单地讲，所谓拟合是指已知某函数的若干离散函数值，通过调整该函数中若干待定系数，使得该函数与已知数据集的差别最小.如果待定函数是线性，就叫线性拟合或者线性回归，否则叫做非线性拟合或者非线性回归.函数表达式也可以是分段函数，这种情况下的拟合叫做样条拟合.

从几何意义上讲，拟合是给定了空间中的一些点，从一个已知函数形式但某些未知参数的连续曲面中找到一个可以最大限度地逼近这些点的函数；而插值是找到一个（或几个分片光滑的）连续曲面来穿过这些点.

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈