首页 百科知识 总样本平均数和方差怎么算

总样本平均数和方差怎么算

时间:2022-10-02 百科知识 版权反馈
【摘要】:当方差分析中只涉及一个因素,其他因素尽可能不变时,称为单因素方差分析。例如,图6-1中要检验的是部门被投诉次数的均值是否相等,这里只涉及“部门”这一个因素,所以是单因素方差分析,它研究“部门”这一个因素对“投诉次数”有无影响。在对话框中选择,单击按钮,进入对话框,如图6-3所示。其中,C部门的投诉次数平均数最少,检验C部门和D部门服务水平具体有没有差异,可以通过双样本假设检验来完成。

方差分析中只涉及一个因素,其他因素尽可能不变时,称为单因素方差分析。例如,图6-1中要检验的是部门被投诉次数的均值是否相等,这里只涉及“部门”这一个因素,所以是单因素方差分析,它研究“部门”这一个因素对“投诉次数”有无影响。

例6.2 以图6-1所示的数据为例,用Excel进行单因素方差分析的操作步骤如下:

(1)建立一工作表,输入数据

如图6-1所示,输入数据。

(2)调用【方差分析:单因素方差分析】

鼠标单击功能区选项【数据】→【分析】中的【数据分析(D)】,则显示【数据分析】对话框,如图6-2所示。

图6-2 数据分析

在【数据分析】对话框中选择【方差分析:单因素方差分析】,单击【确定】按钮,进入【方差分析:单因素方差分析】对话框,如图6-3所示。

图6-3 单因素方差分析工具

(3)在【方差分析:单因素方差分析】对话框中输入相应的参数

如图6-3所示,单击【输入区域(I)】右侧文本框,将光标置于其中,然后用鼠标选择B1:E8单元格,再单击【标志位于第一行(L)】左侧的“□”,使其中出现“√”,α(A)常选择默认值0.05,不用修改;单击【输出区域】左侧的“○”,使其中出“·”,然后用鼠标单击【输出区域】右侧的文本框,将光标置于其中,单击一空白单元格,此例为D11单元格,最后单击【确定】按钮,则会出现如图6-4所示运算结果。

图6-4 单因素方差分析运算结果

(4)运算结果说明

①【SUMMARY】部分。

“SUMMARY”意思为“摘要”,说明四个部门投诉次数描述的统计指标,其中,“观测数”是指各个水平(处理、变量)的观测值个数;“求和”是指各部门投诉次数合计;“平均”是指各部门投诉次数的样本平均数;“方差”是指各部门投诉的次数的样本方差。

以A部门为例,“平均”是指平均数,即4.86=34÷7;方差1.81=[(7-4.86)2+(6-4.86)2+(5-4.86)2+(4-4.86)2+(3-4.86)2+(5-4.86)2+(4-4.86)2]/(7-1),B、C、D部门计算方法与A部门类似。照此计算,B部门离差平方和为6.83,除以(6-1),得方差1.37;C部门离差平方和为2.00,除以(5-1),得方差0.50;D部门离差平方和为2.80,除以(5-1),得方差0.70。

②【方差分析】部分。

【差异源】是所有样本单位观测值与它们平均数的离差,包括由控制因素引起的组间离差和由随机因素引起的组内离差。

【组间】是指23个样本单位观测值根据因素的不同水平(即不同部门)分成了4个样本,即4个组,一个组代表一个样本。【组间】的差异源就是不同样本之间的差异,用样本平均数之间的差异表示。

【组内】的差异源是指样本中样本单位观测值与样本平均数之间差异。

【总计】即【组间】与【组内】差异的合计。

【SS】表示“误差平方和”或“离差平方和”。

组间【SS】,要计算出组间离差平方和,需要先计算出A、B、C、D四部门被投诉次数的平均数,即总的平均数为(34+31+15+19)÷(7+6+5+5)=4.30,然后计算(4.86-4.30)2×7+(5.17-4.30)2×6+(3.00-4.30)2×5+(3.80-4.30)2×5,即可得16.43(与16.38不符的原因是小数位保留了两位)。式中,每一组平均数与总平均数的离差平方乘以每组观测值个数,是假设每组没有随机因素的影响下,每个因素水平表现为每个部门平均数,这样就消除了每个样本单位观测值之间的随机误差,不同样本平均数与总平均数的离差平方和是组间差异,是对处理引起差异的衡量。

【组内SS】计算出组内误差平方和22.49=1.81×(7-1)+1.37×(6-1)+0.50×(5-1)+0.70×(5-1),其意义是每个样本的样本单位观测值与其样本平均数的离差平方和的合计,是对随机因素影响的衡量。

【总计】38.87=16.38+22.49=var(B2:E8)×22。

【df】表示自由度,即样本单位能够自由取值的个数。组间自由度为4-1=3,组内自由度为7+6+5+5-4=19,自由度的合计为19+3=22。

【MS】通常称为“均方差”,是用“离差平方和”除以“自由度”,即离差平方和的平均数除以自由度,它消除了样本单位观测值自由取值的个数的影响。组间均方差为5.46=16.38÷3,组内均方差为1.18=22.49÷19。

【F】表示F统计量。F统计量4.61=5.46÷1.18,即组间均方差是组内均方差的4.61倍。

【P-value】表示概率。P-value=0.01,即出现组间方差是组内方差的4.61倍的可能性为0.01。

【Fcrit】表示F临界值,表示在显著性水平α=0.05条件下,F临界值等于3.13。

在本例中,P-value=0.01,小于α=0.05,说明部门对投诉次数有显著影响,另外,F=4.61,大于Fcrit=3.13,也表明方差分析中原假设不成立,即不同部门间的投诉次数差异显著,也就是不同部门间服务质量有差异。其中,C部门的投诉次数平均数最少,检验C部门和D部门服务水平具体有没有差异,可以通过双样本假设检验来完成。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈