首页 百科知识 测试数据的处理

测试数据的处理

时间:2022-10-18 百科知识 版权反馈
【摘要】:为保证所测试数据的准确有效,保证测试精度,在后一种数据系列的情况中,必须对所测数据排除一些无意义的数字,对其进行有效的处理。如50.3表示三位有效数字;4000.2表示五位有效数字。在闸门检测中,为了了解闸门的材料力学性能,而需要对闸门构件的材料力学性能进行测试。前两种方法将在后面介绍,本章只着重介绍测试数据的解析法。为此,必须对所测数据组中的相关系数r的标准性进行检验。

9.7 测试数据的处理

在闸门动力测试中,有些测试数据是以模拟量形式出现的时间历程记录曲线,有些测试数据是直接以数字形式出现的数据系列等。为保证所测试数据的准确有效,保证测试精度,在后一种数据系列的情况中,必须对所测数据排除一些无意义的数字,对其进行有效的处理。

9.7.1 测试数据的有效数字处理

9.7.1.1 有效数字的定义

表示一个数中的任何一个有意义的数字,称为有效数字。显然在数中存在着无意义的数字,因为任何测试值中均存在误差,都是由测量的近似值代替测量值造成的。例如,在记录实验数据时,已暗示它的最后一位数字是估计值,是可疑的,即这位数字是没有意义的,其余各位数(包括“0”在内)都必须是有意义的数字。如50.3表示三位有效数字;4000.2表示五位有效数字。

9.7.1.2 有效数字的位数

在闸门动力测试的数据表示和计算中,确定有效数字的位数,即能用几位有效数字是很重要的,它取决于测试手段(仪器、仪表和量具等)的分辨率。测试时应估读到仪表刻度上最小分格的分数,测试值的原始数据只能保留一位不准确的数字。如用百分表测量刚架的位移,其有效数字可达四位,即1.343mm,末位数“3”是估读的,是不准确的。数字“0”也可能是有效数字,如另一测点的位移是1.340mm,末位数的“0”是有意义的,是有效的,因为它表示测试值的精度,不能舍去。但如果将其表示为0.001340m,那么“1”前的三个“0”不是有效数字,它的有效数字还是四位。可见,在有效数字中间的“0”,和处于有小数点的有效位数的末位数“0”都是有效数字,但处于第一个非“0”的数字“1”之前的“0”不是有效数字。

对于那些没有小数点的数,又无法确定它是几位有效数字,可将之变成有小数点带指数形成的数来表示。如,23000没有小数点,此时可将之写成2.30×104表示有效数字为三位;若写成2.300×104表示有效数字为四位,同理,2.3000×104表示有效数字为五位,2.3×104表示有效数字为两位。

9.7.1.3 有效数字尾数处理的修约规则

当依据仪器的精度确定了有效数字的位数后,其余数字一并弃之。并弃的规则是按我国1987年制定的《数值修约规则》(G81770-87)进行。“规则”要修约尾数的第一位数可简化为“四舍六入五考察,五后非零应进一,五后皆零视奇偶,五前为偶(含零)应舍去,五前为奇则进一”。例如将下列各数取为三位有效数字。

即13.3452→13.3(四舍);

 25.4743→25.5(六入);

 2.05501→2.06(五后非零进一);

 2.08500→2.08(五后皆零,五前为偶应舍去);

 2.07500→2.08(五后皆零,五前为奇则进一)。

 9.7.1.4有效数字的运算法则

在处理测试数据时一般需要对不同精度的有效数字进行运算,既要保证必要的精度,又要避免过繁的计算。原则上运算值也只需保留一位不准确的数字。运算法则如下:

(1)记录的测试数据,只保留一位估读数字。

(2)加减运算时,对参加运算的各测试数据应统一小数点的位数,且以各数据中小数点后位数最少者为准。例如:

    12.58+ 0.3+ 5.425

应写为 12.6+ 0.3+ 5.4= 18.3

而不应写为18.305。

(3)乘除运算(包括乘方、开方)时,各因子保留的位数以有效位数最少的为准,运算结果保留的位数也只能与各因子中位数最少的相同。如为不同单位的量相乘除得到复合单位量,则各因子可保留原有位数进行运算,所得结果的位数,按该物理量常用精度确定。例如,用拉伸试验机测试低碳钢的屈服应力σs,现测得试件直径d= 10.04mm,屈服荷载Fs= 18.4kN。根据国家标准GB228-87,其横截面积S由79.17mm2修约为79.2mm2,由0.2323kN/mm2修约为0.23kN/mm2即= 230N/mm2,即为测试值。

(4)对于4个以上的数据,其算术平均值的有效数字可增加一位。

(5)表示精度,一般只取一位有效数字,最多两位。

9.7.2 实验试件数的估算

在闸门检测中,为了了解闸门的材料力学性能,而需要对闸门构件的材料力学性能进行测试。有些构件的力学性能往往是由多个试件组成的样本进行实验,取其实验结果的平均值去估计其总体的均值。所以样本均值实际代替了总体均值,成为其力学性能参数的代表。但是,由样本均值去代替总体均值时,必然会带来误差。而误差容许多大时,才能用样本均值去估计总体均值呢?这就涉及要用多少个试件才能满足容许误差的问题。在数理统计中,解决的方法可用下式确定:

img911

式中:δ——误差限度,一般取5%;

n——为所需试件的最少个数;

tr——是置信概率为r时,t分布临界值,可由表9-1查得;

X——为样本从均值,是算术平均值,它表示测量数据的平均水平。均值由下式计算:

img912

Xi——为所测试数据X1,X2,…,Xn的几个数据中的任一个;

S——为样本的标准差,它表示这一组数据对平均值的偏离程度。标准差愈大,数据愈分散,可由下式计算:

img913

算术平均值与标准差的有效数字位数应比原测试值多一位。

表9-1 t分布的临界值表

img914

续表

img915

当试件数量满足式(9-8)的精度要求时,表示试件数量满足要求;当试件数量不满足式(9-8)的精度要求时,表示试件数量不足,还应增加试件数量。

下面举一测试KIC平均值的例子,说明确定n的方法。

例1用一组B= 15mm标准三点弯曲试件测定一种状态下LC4的断裂韧度KIC平均值,并确定实验试件最少的件数。要求它在90%置信下与真值误差小于5%。

解: 先从制备件中任取三根测出KIC值为:

X= KIC= 29.87,29.65和32.41(MPaimg916)

因    n=3

依式(9-9),得

img917

依式(9-10),得

img918

img919

再由n= 3,r= 90%查表9-1得tr= 2.920,又δ= 5%,

img920

显然img921,不满足要求。增加一根试件进行补测,测得

img922

这样就共有四个KIC值(n= 4),分别为29.87MPaimg923、29.65MPaimg924、30.21MPaimg925和32.41MPaimg926,由此算出

img927

再由n= 4,r= 90%,查表得tr= 2.353,

img928

显然img929,所以K= 30.54MPaimg930即为所求之K的平均值,实验试件最少要取4根。

9.7.3测试数据的表示法

测试数据的表示方法有列表法、图解法和解析法三种。列表法是按一定格式和顺序,将测试数据中的自变量和因变量一一对应地列在表格里,以便对比分析和计算。它是图解法和分析法的基础。图解法是按选定的坐标(直角坐标系、极坐标系、对数和半对数坐标系等),把测试数据描成曲线(或直线)图形。它可以直观地显示测试数据的最大值或最小值、转折点及周期性等,形象地反映多变量间的关系。解析法是运用数理统计学中的回归分析方法,对大量的测试数据进行分析处理,找出一个比较符合事物内在规律的数学表达式——方程式和经验公式。它可用于微分、积分、插值等多种运算,进一步描述变量之间的相互关系和揭示问题的本质。前两种方法将在后面介绍,本章只着重介绍测试数据的解析法。

解析法中主要采用回归分析法,用回归分析法确定的各变量之间的关系称为回归方程,回归方程中所含的系数称为回归系数。例如,变量X,Y之间的回归方程为Y= a+ bx,则a,b称为回归系数。

对测试数据进行回归分析,主要解决回归方程的类型、回归系数、常数项的确定以及变量之间的线性关系问题。

9.7.3.1回归方程

对于一组实测数据的回归方程,除了要有一定的专业理论知识和实践经验之外,主要用最小二乘法原理来确定。

设由测试结果,取得了n对数据(Xi,Yi),i= 1,2,…,n。然后,依据样本数据在X-Y直角坐标系中描点,作出数据散点图,从图中直观看是否在随机变量间相互关系与其函数形式。设本例的散点图如图9-10所示。图中的数据点形成一线性分布带,故可以假定XY间有线性相关关系,其回归方程为

img931

回归系数和常数项可用最小二乘法确定为

img932

式中:n为样本数据的点数。

为了描述二变量X,Y之间的线性相关关系的密切程度,常用相关系数r表示,即

img933

当|r|=0时,表示X与Y之间线性不相关;

当0<|r|<1时,表示X与Y之间存在着一定的线性关系;

当r→|1|时,表示X与Y之间线性关系密切相关。

一般要求|r|≥0.8时,才有意义。

img934

图9-10 散点图

9.7.3.2 相关系数的标准性检验

相关系数r是表示X与Y之间的相关系数,但有时也可能受到其测点多少的影响,如在某一组测点数据中,r的绝对值大于0.8,这就可用回归直线表示X与Y之间的关系,就可配置一条回归直线,如图9-11(a)所示,但当其测点再增加,即增大n,此时就可能如图9-11(b)所示,它就显示出X与Y不成线性相关了。为此,必须对所测数据组中的相关系数r的标准性进行检验。

img935

图9-11

为了方便检验,特制定一个相关系数标准性检验表,如表9-2所示。该表给出了不同的(n-2)值在危险率α= 0.01及α= 0.05时的相关系数标准检验值。这些值是相关系数的起码值,通常称之为标准值或临界值记做rα。若子样相关系数r在一定危险率下超过表上数值时,就认为r达到了标准值,此时配制回归直线才有意义。

检验步骤如下:

(1)按式(9-13)

img936

算出r;

表9-2 相关系数标准性检验表

img937

(2)给定危险率α,按(n-2)数值在表9-2上,可查得相应的标准值rα;

(3)比较|r|与rα的大小,如果|r|<rα,则X与Y之间不存在线性相关关系,|r|在危险率α下,用直线配X与Y之间的关系是不合理的。如果r>rα,则X与Y之间存在线性相关关系,r在危险率α下,用直线配X与Y之间的关系是可行的、合理的、有意义的。

例2 现有某实验测试的lgimg938与lgΔK的数据如表9-3所示。试找出二者之间的经验公式。并检验X与Y之间是否有线性相关关系(设α= 0.05)。

表9-3 某实验测试的lgimg939~lgΔK的数据计算表

img940

解:

(1)作散点图,如图9-10所示。由图可知,可用线性模拟;

(2)求回归直线:由表9-3计算出∑Xi、∑Yi、∑Xi Yi、∑img941、∑img942等值,将这些值代入式(9-12),可得

b= 2.4251,a=-8.9491

(3)依式(9-13)计算相关系数:

img943

(4)相关系数的标准性检验

根据α= 0.05、n-2= 14由表9-2查得rα=0.05= 0.497,显然r= 0.975>rα=0.05= 0.497,所以用直线拟合X与Y之间的相互关系是合理的、有意义的。

由回归直线方程

Y=-8.9494+ 2.4251X

可表示为

img944

式中:lg c=-8.9494,则c= 1×10-9

m= 2.4251≈2.42

img945= 1×10-9(ΔK)2.43

上式即为某实验的img946与ΔK关系的经验公式。

img947

例3某水电工程结构的动力试验,在离结构表面为22cm处的测点测试分析得到:振动作用时间为t= 1.52s;样本采集时间为T= 8s;加速度均方值为X(1)= 37418.89;有效标定值为K= 70.7,则可通过下式计算出离结构表面为22cm处的测点的振动响应加速度为6.27 g(m/s2)。同理即可换算出各次振动的结构各测点的振动响应加速度值,如表9-4所示。

表9-4 某结构的各次振动响应加速度值g(m/s2)

img948

试根据表9-4所提供的离结构表面的距离X与加速度a二者之数据找出二者之间关系的经验公式。并检验a与X之间的线性相关关系(设α= 0.05)。

解:

(1)作散点图(此处没有给出),由图可知,可用线性模拟。

(2)回归分析:根据散点图,假定其关系为一指数函数曲线,曲线的方程为

img949

式中:a——结构内测点的振动加速度,由表9-4可知(m/s2);

X——加速度计离结构表面的距离(cm); a0——结构表面最大分析加速度(m/s2)。

img950

b——衰减指数的系数。

img951

其中,n为加速度计安置数量,此处n= 4。

现列表计算如下(表9-5):

表9-5 各参数计算值表

img952

依式(9-18)、式(9-16)和式(9-15),算得

b=-0.011

a'0= 1.89

a0= 6.62

又依式(9-14)得回归分析后,该结构加速度衰减的指数函数曲线方程为

img953

上式即为离结构表面的距离X与加速度a二者之间的经验公式。

(3)依下式计算相关系数

img954

计算结果:r=-0.921,说明X与a为负相关,但是关系密切。

(4)相关系数的标准性检验

根据α= 0.05,n-2= 2。由表9-2查得rα= 0.950,显然,r<rα,说明a与X之间存在的非线性关系,经过变量转化为线性关系后,在对数坐标系中,经验公式(9-19)的直线相关性好。因此,用指数函数曲线配以X与a之间的非线性关系是合理的、有意义的。所以式(9-19)就是X与a之间的关系的经验公式。

(5)回归方程的精度检验

可通过式(9-21)

img955

计算出估计误差Sa'X来说明回归方程的精确程度。计算结果为Sa'X=±0.12。可依据Sa'X值对各层深处的加速度进行修正估算。如X= 48cm处的修正估算加速度为(3.90±0.12) g,即此处的加速度为(3.78~4.02)g。

回归分析是以最小二乘法为基础的,所以,确定回归方程应首先考虑最小二乘法。回归分析可分为线性回归和非线性回归分析,一元回归分析和多元回归分析。研究两个变量之间的相互关系称为一元回归分析;研究两个以上变量之间的相互关系称为多元回归分析。若两个变量之间的内在关系不是线性的,而是某种曲线关系,则称为一元非线性分析(如例3)。例2的处理方法是一元线性回归分析法,此法是最基本的、最常用的方法。对应非线性回归问题,可以通过适当的变量转化为线性回归问题,如在例3中,通过对方程两边取对数,并令a'= lna0、asub0=e a'0、a'=img956(∑a'-b∑X)等进行变换,将X与a的非线性方程转化为线性方程表示在对数坐标系中,这就是“变量转换法”。此外还可用“多项式拟合法”等,将非线性的曲线方程转化为线性方程,将多元回归问题转化为一元回归问题,这样就可使多元线性或非线性问题和一元非线性问题得以解决。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈