首页 百科知识 实验数据的表示法

实验数据的表示法

时间:2022-08-24 百科知识 版权反馈
【摘要】:常用的实验数据表示方法有列表表示法、图形表示法和方程表示法3种。实验数据用列表或图形表示后,使用时虽然较直观简便,但不便于理论分析研究,故常需要用数学表达式来反映自变量与因变量的关系,即采用方程表示法。求出的相关系数大于表中的数时,表明上述用一元线性回归配出的直线是有意义的。在固体废物处理与处置工程中遇到如下问题:有时两个变量之间的关系并不是线性关系,而是某种曲线关系。

对实验数据进行误差分析整理,剔除错误数据并分析各个因素对实验结果的影响后,还要将实验获得的数据进行归纳整理,用图形、表格或经验公式加以表示,以找出影响研究事物的各因素之间相互影响的规律,为得到正确的结论提供可靠的信息。

常用的实验数据表示方法有列表表示法、图形表示法和方程表示法3种。表示方法的选择主要是依靠经验,可以用其中的1种方法,也可2种或3种方法同时使用。

3.4.1 列表表示法

列表表示法是将一组实验数据中的自变量、因变量的各个数据依一定的形式和顺序一一对应列出来,借以反映各变量之间的关系。

列表表示法具有简单易操作、形式紧凑、数据容易参考比较等优点,但对客观规律的反映不如图形表示法和方程表示法明确,在理论分析方面使用不方便。

完整的表格应包括表的序号、标题、表内项目的名称和单位、说明以及数据来源等。

实验测得的数据,其自变量和因变量的变化有时是不规律的,使用起来很不方便。此时可以通过数据的分度,使表中所列数据有规律地排列,即当自变量作等间距顺序变化时,因变量也随之顺序变化。这样的表格查阅较方便。数据分度的方法有多种,较为简便的方法是先用原始数据(即未分度的数据)画图,作出一光滑曲线,然后在曲线上一一读出所需的数据(自变量作等间距顺序变化),并列出表格。

3.4.2 图形表示法

图形表示法的优点在于形式简明直观,便于比较,易显出数据中的最高点或最低点、转折点、周期性以及其他奇异性等。当图形作得足够准确时,可以不必知道变量间的数学关系,对变量求微分或积分后得到需要的结果。

图形表示法可用于两种场合:

(1)已知变量间的依赖关系图形,通过实验,将获得的数据作图,然后求出相应的一些参数;

(2)两个变量之间的关系不清,将实验数据点绘于坐标纸上,用以分析、反映变量之间的关系和规律。

图形表示法包括以下4个步骤:

1. 坐标纸的选择

常用的坐标纸有直角坐标纸、半对数坐标纸和双对数坐标纸等。选择坐标纸时,应根据研究变量间的关系,确定选用哪一种坐标纸。坐标不宜太密或太稀。

2. 坐标分度和分度值标记

坐标分度指沿坐标轴规定各条坐标线所代表的数值的大小。进行坐标分度应注意下列几点:

(1) 一般以x轴代表自变量,y轴代表因变量。在坐标纸上应注明名称和所用计量单位。分度的选择应使每一点在坐标纸上都能够迅速方便的找到。

(2) 坐标原点不一定就是零点,也可用低于实验数据中最低值的某一整数作起点,高于最高值的某一整数作终点。坐标分度应与实验精度一致,不宜过细,也不能过粗。

(3) 为便于阅读,有时除了标记坐标纸上主坐标线的分度值外,还会在细副线上也标以数值。

3. 根据实验数据描点和作曲线

描点方法比较简单,把实验得到的自变量与因变量一一对应的点标在坐标纸上即可。若在同一图上表示不同的实验结果,则应采用不同符号加以区别,并注明符号的意义。

作曲线的方法有两种:

(1) 数据不够充分,图上的点数较少,不易确定自变量与因变量之间的关系,或者自变量与因变量间不一定呈函数关系时,最好是将各点用直线连接。

(2) 实验数据充分,图上点数足够多,自变量与因变量呈函数关系,则可作出光滑连续的曲线。

4. 注解说明

每一个图形下面应有图名,可将图形的意义清楚准确地表述出来,有时在图名下还需加一些简要说明。此外,还应注明数据的来源,如作者姓名、实验地点、日期等。

3.4.3 方程表示法

实验数据用列表或图形表示后,使用时虽然较直观简便,但不便于理论分析研究,故常需要用数学表达式来反映自变量与因变量的关系,即采用方程表示法。方程表示法通常包括下面两个步骤:

步骤一:选择经验公式。

表示一组实验数据的经验公式应形式简单紧凑,式中系数不宜太多。一般没有一个简单方法可以直接获得一个较理想的经验公式,通常是先将实验数据在直角坐标纸上描点,再根据经验和解析几何知识推测经验公式的形式,若经验表明此形式不够理想,则应另立新式,再进行实验,直至得到满意的结果为止。表达式中容易直接用于实验验证的是直线方程,因此,应尽量使所得函数形式呈直线式。若得到的函数形式不是直线式,则可以通过变量变换,使所得图形变为直线。

步骤二:确定经验公式的系数。

确定经验公式中系数的方法有多种,在此仅介绍直线图解法和回归分析中的一元线性回归、一元非线性回归以及回归线的相关系数与精度。

1. 直线图解法

凡实验数据可直接绘成一条直线或经过变量变换后能变为直线的都可以用此法。具体方法如下:将自变量与因变量一一对应的点绘在坐标纸上并作直线,使直线两边的点差不多相等,并使每一点尽量靠近直线。所得直线的斜率就是直线方程y=a+bx中的系数b,y轴上的截距就是直线方程中的a。直线的斜率可用直角三角形的Δy/Δx比值求得。

直线图解法的优点是简便,但由于不同的人用直尺凭视觉画出的直线可能不同,因此,精度较差。当问题比较简单,或者精度要求低于0.2%~0.5%时可以用此法。

2. 一元线性回归

一元线性回归就是工程上和科研中常常遇到的配直线的问题,即两个变量x和y存在一定的线性相关关系,通过实验取得数据后,用最小二乘法求出系数a和b,并建立回归方程ˆyabx=+(称为y对x的回归线)。

用最小二乘法求系数时,应满足以下两个假定:

(1) 所有自变量的各个给定值均无误差,因变量的各值可带有测定误差。(2) 最佳直线应使各实验点与直线的偏差的平方和为最小。

由于偏差的平方均为正数,如果平方和为最小,则说明这些偏差很小,所得的回归线即为最佳线。

计算式如下:

式中

一元线性回归的计算步骤如下:

(1) 将实验数据列入一元回归计算表(表3-4),并计算。

表3-4 一元回归计算表

3. 回归线的相关系数与精度

用上述方法配出的回归线是否有意义?两个变量间是否确实存在线性关系?在数学上引进了相关系数r来检验回归线有无意义,用相关系数的大小判断建立的经验公式是否正确。

相关系数r是判断两个变量之间相关关系的密切程度的指标,它有下述特点:

(1) 相关系数是介于-1与1之间的某任意值。

(2) 当r =0时,说明变量y的变化可能与x无关,这时x与y没有线性关系。

(3) 当0<|r|<1时,x与y之间存在着一定线性关系。当r>0时,直线斜率是正的,y随x增大而增大,此时称x与y正相关;当r<0时,直线斜率是负的,y随着x的增大而减小,此时称x与y负相关。

(4) 当|r|=1时,x与y完全线性相关。当r=+1时,称为完全正相关;当r=-1时,称为完全负相关。

相关系数只表示x与y线性相关的密切程度,当|r|很小甚至为零时,只表明x与y之间线性相关不密切,或不存在线性关系,并不表示x与y之间没有关系,可能两者存在着非线性关系。

相关系数计算式如下:

相关系数的绝对值越接近1,x与y的线性关系越好。

附录3给出了相关系数检验表,表中的数称为相关系数的起码值。求出的相关系数大于表中的数时,表明上述用一元线性回归配出的直线是有意义的。

回归线的精度用于表示实测的yi偏离回归线的程度。回归线的精度可以用标准误差来估计,其计算式为

式中 ˆiy——xi代入ˆy=a+bx的计算结果。

显然,s越小,yi离回归线越近,则回归方程精度越高。这里的标准误差称为剩余标准差。

4. 一元非线性回归

在固体废物处理与处置工程中遇到如下问题:有时两个变量之间的关系并不是线性关系,而是某种曲线关系。这时,需要解决选配适当类型的曲线以及确定相关函数中的系数等问题。具体步骤如下:

(1) 确定变量间函数的类型的方法有两种:① 根据已有的专业知识确定;② 实在无法确定变量间函数关系的类型时,先根据实验数据作散布图,再从散布图的分布形状选择适当的曲线来配合。

(2) 确定相关函数中的系数:确定函数类型以后,需要确定函数关系式中的系数。其方法如下:① 通过坐标变换(即变量变换)把非线性函数关系化呈线性关系,即化曲线为直线;② 在新坐标线中用线性回归方法配出回归线;③ 还原回原坐标系,即得所求回归方程。

(3) 如果散布图所反映的变量之间的关系与两种函数类型相似,无法确定选用哪一种曲线形式更好,则可以都作回归线,再计算它们的剩余标准差并进行比较,选择剩余标准差小的函数类型。

附录1 格拉布斯(Grubbs)检验临界值Ta

附录2 F分布表

续表

附录3 相关系数检验表

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈