首页 理论教育 正态总体参数的区间估计

正态总体参数的区间估计

时间:2022-02-12 理论教育 版权反馈
【摘要】:此时,区间的平均长度为,根据正态分布的对称性知取时,区间的长度L最短。求真值μ的置信水平为95%的置信区间。假设该校学生的月消费X服从正态分布,请以90%的置信水平给出该校学生的月平均消费μ的区间估计。所以,求有关成对数据的两均值差的置信区间问题可以转化为求单个正态总体均值μd的置信区间。设苹果的重量服从正态分布,试求其方差σ2的置信水平为99%的置信区间。

(一)单个正态总体情形

设总体是来自总体X的样本。S2分别是样本均值和样本方差,1-α是给定的置信水平。

1.均值μ置信区间

(a)σ2已知

我们常取μ的点估计为样本均值,根据第六章抽样分布定理6.3.1知,即有,分布完全已知,因此,我们可取枢轴量为

设常数a<b,且满足

此时,区间的平均长度为,根据正态分布的对称性知取时,区间的长度L最短。从而所对应的μ的置信水平为1-α的置信区间

是最优的区间估计,上式常写成

例7.4.1 某制药商从每批产品中抽取一个样品进行分析,以确定该产品中活性成分的含量。通常情况下,化学分析并不是完全精确的,对同一个样本进行重复的测量会得到不同结果,重复测量的结果通常近似服从正态分布。根据经验,活性成分含量的标准差为σ=0.0068(克/升),假设化学分析过程没有系统偏差,设活性成分的含量的真值为μ。对样品进行三次重复测量结果如下:0.8403,0.8333,0.8477。求真值μ的置信水平为95%的置信区间。

 该样品三次测量的平均值为。由给定的置信水平95%,利用Excel或查正态分布表得z0.025=1.96.所以,μ的置信水平为95%的置信区间为

注意,区间(0.8327,0.8480)已经不是随机区间了,但我们仍称它为置信水平为0.95的置信区间。其含义是:若反复抽样多次(样本容量相同),每个样本值按(7.4.1)确定一个区间。在诸多区间中,包含μ真值的约占95%,不包含μ的约占5%。现在抽样得到区间(0.8327,0.8481),则该区间属于那些包含μ的区间的可信程度为95%。

在第二章,第六章中,已经介绍如何利用Excel的功能计算各种分布的概率和分位数。实际上,我们还可以利用Excel中的各种统计函数对数据进行统计分析。下面我们给出例7.4.1在Excel中计算的具体步骤:

(1)先将样本观察值输入Excel表格中,设数据区域为A1到A3。

(2)利用AVERAGE函数计算样本均值,需给出数据区域。

在Excel表中选择任一空白单元格(例如:选中A4单元格)输入“=AVERAGE(A1:A3)”点击Enter键A4单元格即可显示均值为“0.840433”。

(3)利用CONFIDENCE函数计算误差限,需给出ασn三选项的值。

在Excel表中选择任一空白单元格(例如:选中A5单元格)输入“=CONFIDENCE(0.05,0.0068,3)”点击Enter键A5单元格即可显示误差限为“0.007695”。

(4)区间估计。

μ的置信水平为95%的置信区间为:(0.840433-0.007695,0840433+0.007695)=(0.8327,0.8481)。

除直接输入函数外,我们也可利用下拉菜单来选择函数。

AVERAGE函数的选择:

在Excel表中选择任一空白单元格(例如:选中B1单元格)输入“=”下拉菜单“插入”选项卡单击“函数”在类别的下拉式菜单中,选择“统计”选项选择“AVERAG弹出的对话框的“Number1文本框中输入”A1:A3”点击Enter键B1单元格即可显示均值为“0.840433”。

CONFIDENCE函数的选择:

在Excel表中选择任一空白单元格(例如:选中B2单元格)输入“=”下拉菜单“插入”选项卡单击“函数”在类别的下拉式菜单中,选择“统计”选项在选择函数列表中选择“CONFIDENCE”在弹出的对话框的“Alpha”文本框中输入“0.05”,在“Standard-dev”文本框中输入“0.0068”,在“Size”本文框中输入“3”点击Enter键B2单元格即可显示误差限为“0.007695”。

(b)σ2未知

此时,我们不能取为枢轴量,因其中除了含有待估参数μ以外,还含有未知参数σ2。考虑将σ2的无偏估计量S2代入,由第六章抽样分布定理6.3.3有

分布完全已知。因此,我们可取枢轴量为

于是求得μ的置信水平为1-α的置信区间为

根据t分布的对称性可知,上述所求得的置信区间是最优的。

在实际问题中,总体方差σ2经常是未知的,故区间(7.4.3)较区间(7.4.2)有更大的实用价值。

例7.4.2 为了解某高校在校大学生的生活消费情况,随机抽取了45名同学,调查得到这些同学的平均月消费元,标准差s=150元。假设该校学生的月消费X服从正态分布,请以90%的置信水平给出该校学生的月平均消费μ的区间估计。

 利用Excel或查t分布表得t0.05(44)=1.6802,并将样本资料s=150代入((7.4.3)得区间估计为(1218.430,1293.570),即我们有90%的把握认为该校学生的月平均消费在1218元至1294元范围内。

 Excel中的CONFIDENCE函数只适用于计算正态分布下总体标准差已知的误差限。

(c)成对数据情形

成对数据问题在医学和生物研究领域中广泛存在。例如,为了考察某种降血压药的效果,测试了n个高血压病人在服药前后的血压分别为。显然,对同一个病人,XiYi是不独立的。另一方面,由于不同病人体质的差异,不能看成来自同一个正态总体的样本,也一样。但差值则消除了人的体质差异,仅与降血压药的作用有关。因此我们可以把看成来自同一个正态总体的样本。所以,求有关成对数据的两均值差的置信区间问题可以转化为求单个正态总体均值μd的置信区间。根据前面的推导可得μd的置信水平为1-α的置信区间为

其中

例7.4.3 AB两种小麦品种分别播种在8块试验田中,每块试验田AB品种各种一半,收获后8块试验田的产量如下所示(单位:kg)

假设两品种产量的差服从正态分布,求两品种产量的期望差的置信区间(α=0.05)。

 这是成对数据问题。由已知资料计算得

。查t分布表得t0.025(7)=2.365,并将代入(7.4.4),得两品种产量期望差的置信水平为95%置信区间为(7.149,20.101)。

Excel计算步骤:

(1)将上述di数据输入Excel表格中,设数据区域为A1:A8。

(2)在Excel表中选择任一空白单元格(例如:选中A9单元格)输入“=AVERAGE(A1:A8)”点击Enter键A9单元格即可显示样本均值为“13.625”。

(3)在Excel表中选择任一空白单元格(例如:选中A10单元格)输入“=STDEV(A1:A8)”点击Enter键A10单元格即可显示样本标准sd为“7.744814”。

(4)在Excel表中选择任一空白单元格(例如:选中A11单元格)输入“=TINV(0.05,7)”点击Enter键A11单元格即可显示t0.025(7)为“2.364624”。

(5)将上述结果代入(7.4.4)中,得区间估计为

2.方差σ2的区间估计

此处,我们根据实际问题的需要,只介绍μ未知的情形。

σ2的无偏估计量为样本方差S2,且由第六章抽样分布定理6.3.2知,,分布不依赖于任何未知参数。因此,我们可取枢轴量为

这样就求得方差σ2的置信水平为1-α的置信区间为

注意,因分布的密度函数是不对称的,故以上所求得的置信区间并不满足区间平均长度最短,但这样的解给实际应用带来方便。

例7.4.4 一个园艺科学家正在培养一个新品种苹果,这种苹果除了口感好和颜色鲜艳外,另一个重要特征是单个重量差异不大,为了评估新苹果,她随机挑选了25个苹果测试重量(单位:克)。其样本方差s2=4.25。设苹果的重量服从正态分布,试求其方差σ2的置信水平为99%的置信区间。

 利用Excel或查分布表得,并将样本资料s2=4.25代入(7.4.5)得方差σ2的置信水平为99%的置信区间为(2.24,10.31)。

(二)两个正态总体情形

设有两个正态总体为来自总体X的样本,为来自总体Y的样本,两样本相互独立,分别为两样本均值,分别为两样本方差。

1.均值差的区间估计

分三种情况讨论。

(a)当两总体的方差已知

我们取的无偏估计为,则由正态分布的性质有

类似于单个总体的均值区间估计的推导,可得的置信水平为1-α的置信区间为

(b)当两总体的方差相同,即,但未知

此时我们可取σ2的无偏估计量为

且由第六章抽样分布定理6.3.4知

仿照上述推导,可得的置信水平为1-α的置信区间为

(c)当两总体的方差不相同且未知

当样本量n1n2充分大时(一般要求大于50),根据中心极限定理,渐近服从标准正态分布N(0,1),可得的置信水平为1-α的近似置信区间为

对于有限小样本,可以证明

近似服从自由度kt分布,其中

在实际中,也常用min(n1-1,n2-1)近似代替上述自由度k。此时的置信水平为1-α的近似的置信区间为

例7.4.5 对某学校学生配戴眼镜的价格进行抽样调查,男生19人,平均价格242.793元,标准差16.566元,女生17人,平均价格297.783元,标准差19.047元,假设两组样本独立,都来自正态总体且具有相同方差,试给出男生和女生配戴眼镜平均价格差值的95%的区间估计。

 设μ1μ2分别是男生和女生配戴眼镜的平均价格。根据已知资料有

利用Excel或查t分布表得t0.025(34)=2.032。因两总体的方差相同,将上述结果代入(7.4.7)得的置信水平为95%的置信区间为(-67.05,-42.93)。

例7.4.6 为了解某城镇居民的收入情况,随机抽查了115人,其中受过高等教育的62人,调查得其月平均收入为2516元,样本标准差为109元;未受过高等教育的53人,调查得其月平均收入为1550元,样本标准差为87元。假设两组样本独立,都来自正态总体,试给出两组居民平均收入差值的90%的区间估计。

 设分别是受过高等教育和未受过高等教育居民的平均收入。因题中没有假设两总体的方差相等,但两样本容量都大于50,需根据(7.4.8)来求区间估计。

利用Excel或查正态分布表得z0.05=1.645,并将已知资料的置信水平为90%的置信区间为(935.917,996.083)。

例7.4.7 已知甲、乙两灯泡厂生产的灯泡寿命分别服从。为比较两个灯泡厂生产的灯泡质量,从甲、乙两厂生产的灯泡中分别抽取了16和21个灯泡做试验,测得它们的样本均值和样本标准差分别为

请以90%的置信水平估计两厂生产的灯泡平均寿命的差值范围?

 这同样是有关两正态总体均值差的区间估计问题。题中没有假设两总体的方差相等,且两样本容量都小于50,因此需根据(7.4.9)来计算,其中自由度。利用Excel或查正态分布表得t0.05(15)=1.753,并将已知资料的置信水平为90%的置信区间为(-94.416,14.416)。

2.方差比的区间估计

的点估计为,由第六章抽样分布定理6.3.4知

利用枢轴量法,可求得的置信水平为1-α的置信区间为

分布一样,F分布的概率密度同样不具有对称性,因此上述求得的置信区间也不是最优的。

例7.4.8 根据例7.4.6中的数据资料,求受过高等教育和未受过高等教育的居民收入的方差之比的置信区间(α=0.05)。

 利用Excel查得,将样本资料n1=62,n2=53,s1=109,s2=87代入(7.4.10)得所求置信区间为(0.920,2.647)。

表7.4.1 正态总体均值、方差的置信区间与单侧置信限(置信水平为1-α

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈