首页 百科知识 数据的初步整理方法

数据的初步整理方法

时间:2022-08-26 百科知识 版权反馈
【摘要】:平均数的计算是定量分析的最基本的计算方法和处理方法之一,也是我们进一步对数据进行分析的前提。平均数在教育科研中,它反映了一组数据的平均发展水平或集中趋势。下面我们只介绍算术平均数和加权平均数的计算方法及其应用举例。这种平均数的计算方法我们把它叫作加权平均数。标准差是带有与原数据相同的单位的差异量,这种差异量称之为绝对差异量。

数据的录入是指以数据库的形式录入和保存,以利于将来进行统计分析,数据的录入可以用电子表格(如Excl),数据库(如Foxpro系列)等,但不宜以文档的形式录入和保存(如Word文档),这种文档格式不利于进行运算和统计处理。

当然,数据的录入要求准确,这对下一步的统计分析和处理是非常重要的。

1.样本平均数。

平均数的计算是定量分析的最基本的计算方法和处理方法之一,也是我们进一步对数据进行分析的前提。所以,我们有必要将平均数的计算方法和它所反映的意义弄清楚。

平均数在教育科研中,它反映了一组数据的平均发展水平或集中趋势。如测验所得成绩的平均分,它反映了被试学生的这次测验成绩的平均水平。

平均数和它的计算方法有多种,如算术平均数、加权平均数、几何平均数、调和平均数等。下面我们只介绍算术平均数和加权平均数的计算方法及其应用举例。对其他的平均数的计算方法和应用,可以参考相关书籍。

求平均数的最基本的计算公式是:

在计算平均数时,有时会遇到这样的情况:在一给数据中某个数值出现好几次。这时如果要求这一组数据的平均数时,可以用下面的公式进行计算就比较简便些:

其中“”为数据中每个数据所出现的次数, n为样本容量,并且有“” 。这种平均数的计算方法我们把它叫作加权平均数。

在教育研究中,平均数说明什么问题呢?它说明了参与计算的数据的一种集中趋势,有时我们的研究对象的容量比较大时,就可以用它的一个样本平均数去估计总体的平均数。

2.样本方差及标准差。

标准差在教育研究中应用是非常广泛的,这是因为:

一是标准差它反映了全部数据的差异情况。

二是标准差受到抽样变动的影响比较小。

当然,标准差也有它的缺点:即计算比较复杂,结果易受两端数据的影响。标准差与平均数在实际问题中常常结合在一加以应用。一般来说,只有平均数相同或接近相等,至少是没有显著性差异时,比较两组单位相同的数据的标准差才有意义,即要求在同一水平上比较它们的离散程度才是科学的;另外,只有两组数据在同一次测量条件下测量得到的、同一问题的数据才能用标准差进行比较它们的离散程度,这就是标准差的使用条件。

比如,在学校教育教学中,同一次测验的同一学科成绩(比如两个班在同一次数学测验中的成绩比较),在平均分相对接近或相等时就可以比较它们的标准差了。

3.差异系数。

标准差是带有与原数据相同的单位的差异量,这种差异量称之为绝对差异量。绝对差异量对单位不同的或者单位相同而平均数不同的,且相关较大的两组数据则无法比较它们的大小(即离散程度大小),为了解决这一实际问题中存在的问题,我们采用一种叫相对差异量的方法来比较,这种相对差异量叫差异系数(有时也叫变异系数)。

差异系数的计算公式是:

其中为标准差,为平均数。差异系数的特点是:一是它反映了数据分布中相对于自身平均数的离散程度,因此是相对差异量;二是它是一个不带单位的数据,即无单位数。

由于差异系数具有上面的特征,所以在比较两组单位不同的数据的离散程度时,选用差异系数作为一个比较指标就比较合适。如在教育教学研究中,可用来比较不同学科或不同年批次的学生学习成绩的离散程度。

在实际应用中,有时也可以采用差异系数作为考查教师的教学是否面向全体学生的一介指标。

4.图表绘制(图)。

有时一些数据用图表来表示时会比单纯用数据更能说明问题,并且,图表能让人更加直观地理解数据所要说明的问题。

例93:“柳州市中等职业技术学校专业建设调查研究”中的一个图表。

5.例题举要。

(1)平均数的实际应用。

例94:在一项课题的研究中,有5所学校参与了实验,在对课题研究所进行的某一项测量中,这5所学校分别是:A校100名学生,平均分为90分;B校150名学生,平均分为85分;C校90名学生,平均分为80分;D校120名学生,平均分为78分;E校80名学生,平均分为70分。求这5所学校在这项目测验中的总体的平均成绩。

解:根据题意得

所以,这项课题研究中,这5所实验学校的这次测验共有540名学生参加,他们的平均成绩为81.3148分。

在教育研究中,平均数说明什么问题呢?它说明了参与计算的数据的一种集中趋势,有时我们研究的对象容量比较大时,就可以用它的一个样本去估计总体的平均数。如,在上面参与实验的5所学校中,如果是同年级学生都是研究对象,而上面的计算只是它的一个样本的话,那么我们就可以估计出研究对象总体的平均数大约是81.3148分。

(2)标准差的应用。

例95:在某小学进行某一教学研究中,对学生的学业水平的前后两次测试结果分别是:实验前的测试实验班与对比班的数学成绩平均分分别为67.35分和67.50分,计算得标准差分别是2.69和2.91;实验后的测试结果实验班与对比班的平均分分别是89.93分和87.58分,标准差分别是18.44和3.27。问:如何分析比较实验前后的数据的变化?

结论:从实验前测试的数据来看,实验前的平均分和标准差是比较接近的,这说明实验前两个班的学科学习水平基本一致,都在同一个发展水平上,这为实验后的测试所取得的数据的可比性提供了基础。实验后的测试的平均分稍有变化,这说明该实验对提高实验班的学科总体水平有一定的作用,但是由于标准差变化较大,实验班与对比班的标准差的差为15.17分,这说明实验对学生的分化所起的作用比较大,作为基础教育不利于全面地提高学生的学习水平,只对少数尖子学生有利。对这一结果我们可以用如图1来表示。

图1. 实线为实验班的成绩

例96:在上一例题研究中,如果实验前的测试结果不变,但是实验后测试对比班和实验班的平均分分别为68.47和83.06,标准差分别是2.78和2.02。问:怎样评价这一实验结果?

结论:从实验班与对比班实验后的测试的标准差可以看出,这两个班在实验后学生的学习离散程度基本上是相同的,即两极分化程度基本一致,但是,从平均分可以看出,经过这一教学实验研究的实施,实验班学生在该科总体的平均学习水平得到了很大提高,由原来的67.35提高到了83.06分,但对比班的学生学习平均水平并没有得到太大的提高。这说明这一实验

对提高学生的总体学习平均水平是有利的。这结果也可以用如图2表示。

图2 实线为实验班的成绩

(3)差异系数的应用。

例97:在一次参加全市统一考试中,某中学各科成绩统计结果如下:

科 别 语文 数学 英语 物理 化学

平均分 85.8 97.54 80.80 86.73 75.8

标准差 8.72 13.95 5.44 12.65 13.10

问:这五科学生的发展情况如何?哪一科学生出现两极分化比较严重些?或者说哪科的教师在教学过程中“面向全体学生”做得比较好?

结论:由于是比较不同学科的学习成绩,虽然单位相同,但学科不同,不同学科成绩的分布是相对独立的,如果直接用所得的标准差来比较学生两极分化的程度,那么结果最严重的是数学,其次是化学,然后是物理、语文,最好的是英语。但是,由于考试难度不同,平均水平也不相同,这样比较是不太科学的。为了解决这一问题,所以在这里采用差异系数作为这一问题的比较指标就更为合适些。

我们先计算得各科差异系数:

我们先计算得各科差异系数:

从上所计算得到的差异系数看,英语的差异系数最小,然后是语文,数学,物理,最后是化学,也就是说英语发展最整齐,其次是语文、数学、物理,化学分化比较严重。

例98:某校在进行一项教学法的实验研究过程中,对实验前测和实验后测所得的数据如下:实验前测所得的平均分为75.68分,标准差为16.77分,实验后测得到的平均分为85.32分,标准差是18.13分,问:怎样评价实验前后的测试学生成绩分化的变化?

结论:在这一个例子中,虽然所得成绩是同一学科成绩,但它是两次互相独立的不同测试,平均水平也不相同,所以也不能直接用标准差来比较前后两次测试所反映的学生分化程度。我们仍然采用变异系数来比较:

从变异系数的变化看,实验后学生的成绩分化程度小于实验前的分化程度。从表面上看,学生的标准差实验前小于实验后,为什么实验后的分化程度反而小于实验前?这是因为经过实验后,虽然标准差增大了,但它是在总体平均水平提高的前提下增大的。可见,平均水平不同是不能直接用标准差来比较学生的分化程度的,这和前面在讨论平均分及标准差时的所得的结论是一样的。

在实际应用中,有时也可以采用差异系数作为考查教师的教学是否面向全体学生的一个指标。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈