首页 理论教育 总体分布正态性检验的图示方法有

总体分布正态性检验的图示方法有

时间:2022-04-18 理论教育 版权反馈
【摘要】:测量的结果被称为变量值或观察值。3.标准误 标准误用来衡量抽样误差,反映的是样本均数之间的变异。1.适用条件 样本例数n较小,总体标准差未知时样本与总体均数的比较,配对设计资料的比较与两个样本均数的比较。2.率的标准误 反映率的抽样误差大小的指标,它实际上是样本率的标准差。率的标准误可用来估计率的抽样误差。

本节热门考点

1.统计工作设计包括调查设计和实验设计。实验原则:对照、随机和重复。

2.反应数量变量集中趋势的指标有:算数平均数、几何平均数、中位数。离散趋势指标有:全距(极差)、四分位数间距、方差、标准差、变异系数

3.假设检验、t检验和u检验适用条件及检验方法。

4.u检验和χ2检验。

一、基本概念和基本步骤

(一)统计学中的几个基本概念:总体与样本、变量、误差、计量资料及计数资料

1.总体 根据研究目的确定的、同质的全部研究对象,分为有限总体和无限总体。

2.样本 根据随机化的原则从总体中抽出的有代表性的一部分观察单位组成的子集。抽取样本的过程称为抽样。

3.计量资料 指连续的数据,通常有具体的数值。

4.计数资料 又称为定性资料或无序分类变量资料,是将观察单位按某种属性或类别分组计数,分别汇总各组观察单位后得到的资料,其变量值是定性的,表现为互不相容的属性或类别。

5.误差 研究对象的观察值和实际值的差别。包括:①过失误差;②系统误差;③随机测量误差;④随机抽样误差。

6.变量 观察对象的特征或指标,分为定性(分类)变量和定量(数值)变量两种类型。测量的结果被称为变量值或观察值。

(二)统计工作的基本步骤

1.设计 包括调查设计和实验设计。

实验设计的原则:对照、随机和重复。

2.搜集资料 选择得到资料的最佳途径并获取完整、准确、可靠的资料。

3.资料整理 将搜集到的原始资料系统化、条理化,便于进一步计算统计指标和分析。

4.分析资料 ①统计描述:即计算统计指标;②统计推断:即推断总体的特征。

二、统计表和统计图

(一)统计表

1.结构 统计表外观由标题、标目、线条、数字和备注等部分组成,有简单表和复合表两种。

2.要求

(1)标题:简要说明表的中心内容,一般写在表的正上方。

(2)标目:即表内所列项目,横标目在左,表明被研究事物的主要特征;纵标目在表的右上端,说明横标目内容的各项统计指标。

(3)线条:包括顶线、底线、隔开纵标目与数字的横线。

(4)数字:同一指标小数位数保留、单位和精度应一致,表内不留空格。

(5)备注:非必需,用“*”标出,解释在表的下面。

(二)统计图

1.类型 常见的统计图有直方图、累计频率分布图、箱式图、直条图、百分条图、圆图、线图、半对数线图、散点图和统计地图等。

2.统计图的选择

(1)条图:适于彼此相互独立的现象间相同指标的比较。

(2)圆图:用来表示全体中各部分的构成情况。

(3)线图:用于描述某指标随时间或条件而变动的趋势,或某一现象随另一现象变迁的情况。

(4)半对数线图:用于表示事物现象发展变化的速度(相对比)。

(5)直方图:用于描述某连续性资料的分布。

(6)散点图:用于双变量统计分析

(7)统计地图:用以显示不同地域事物数量的分布情况。

3.制图通则

(1)标题:概括图的内容,置于图域下方。

(2)图域:制图空间,长宽比例7∶5或5∶7。

(3)标目:图纵轴左侧为纵标目,横轴下方为横标目,并指明指标与单位。

(4)刻度:多用算术尺度或对数尺度,标注于纵轴外侧和横轴上侧。

(5)图例:说明不同线条或颜色所表达的内容,放于横标目下方或图域中。。

三、定量资料的统计描述

(一)集中趋势指标

1.算术平均数 适用于正态分布资料(或近似正态或对称分布)。

(1)符号:总体均数μ,样本均数。

(2)计算公式:直接法:(适于小样本资料)

加权法:(适于频数表资料)

2.几何均数 适用于对数正态分布资料或等比级数资料。

(1)符号:G。

(2)计算公式:直接法: (适于小样本资料)

加权法:(适于频数表资料)

3.中位数 适用于任何分布类型的数值变量资料,常用于描述偏态分布资料、一端或两端无界的资料、频数分布类型不清楚的集中趋势。

(1)符号:M。

(2)计算公式 直接法:(n为奇数)

M=(n为偶数)

加权法:

(二)离散程度指标

1.极差 含义:极差又称为全距,即观察值中最大值和最小值之差,用R表示。

公式:R=Xmax−Xmin

2.标准差 适用于正态和近似正态分布资料。

(1)符号:总体标准差σ,样本标准差S。

(2)计算公式:

3.四分位间距 把所有的观察值排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的25%,去掉两端的25%,取中间50%观察数值的数据范围即为四分位数间距。用Q表示,公式:Q=P75−P25

4.变异系数 需要对均数相差较大或单位不同的几组观察值的变异程度进行比较,需要用到变异系数(CV),

四、定量资料的统计推断

(一)均数的抽样误差和标准误

1.定义 均数抽样误差是指由于抽样引起的样本均数与总体均数之间的误差,用均数的标准误表示,符号为

2.计算公式。实际研究中σ未知,用s代替求标准误的近似值

3.标准误 标准误用来衡量抽样误差,反映的是样本均数之间的变异。标准误越小,表明样本统计量与总体参数的值越接近。

(二)总体均数可信区间及其估计方法

1.可信区间的定义 从总体中做随机抽样,根据每个样本可算得一个可信区间,如95%可信区间,意味着做100次抽样,算得100个可信区间,有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。

2.估计方法

(1)σ已知时,总体均数µ的95%可信区间为:,99%可信区间为:

(2)σ未知,但样本例数n足够大时,总体均数μ的95%的可信区间为:,99%的可信区间为:

(3)σ未知,样本例数较小时,总体均数μ的95%的可信区为:,99%的可信区间为:

(三)t检验

1.适用条件 样本例数n较小,总体标准差未知时样本与总体均数的比较,配对设计资料的比较与两个样本均数的比较。

进行t检验时应注意:样本来自正态分布总体,用于成组设计的两样本均数比较时,要求两样本来自总体方差齐。

2.单样本t检验

(1)目的:推断样本所代表的未知总体均数µ与已知总体均数µ0有无差别。

(2)统计量

3.配对t检验

(1)目的:推断某种处理有无作用,或两种处理的效果有无差别。

(2)统计量:

4.两样本t检验

(1)目的:推断两样本分别代表的总体均数是否相等。

(2)统计量:

ν为两样本均数差值的标准误,为两样本的合并方差,分别为两样本的方差。

五、分类资料的统计描述

常用相对数的种类如下。

1.构成比 说明事物内部各组成部分所占的比重或分布情况。

2.率 又称频率指标,说明某现象发生的频率或强度。

K为比例基数。

3.相对比 指两个有联系的指标之比,常以百分数或倍数表示。两指标可以性质相同,也可以性质不同。

六、分类变量资料的统计推断

(一)率的抽样误差和率的标准误

1.率的抽样误差

(1)定义:由于抽样而引起的样本率与总体率之间的差别,率的抽样误差可用率的标准误来表示。

(2)公式;当总体率π未知时,率标准误估计值表示为

2.率的标准误 反映率的抽样误差大小的指标,它实际上是样本率的标准差。率的标准误可用来估计率的抽样误差。率的标准误越小,率的抽样误差也越小。

(二)总体率可信区间

1.查表法 小样本资料(n≤50),根据样本阳性例数X及样本例数n,直接查二项分布参数π可信区间表。

2.正态近似法 n足够大,p和(1-p)均不太小,且np和n(1-p)均大于5时,样本率p的抽样分布近似服从正态分布,公式估计总体率可信区间:(p-uαsp,p+uαsp)。

(三)χ2检验

1.四格表资料的χ2检验

(1)公式:n>40且T>5时,:

(2)专用公式:

n>40但1<T<5时用连续校正公式:

n≤40或T<1时,用四格表确切概率计算法

2.配对设计四格表资料χ2检验公式

如果b+C<40,则用校正公式计算:

3.行×列表资料χ2检验

(1)公式

(2)注意事项

①做行×列表资料χ2检验时,允许有1/5以下的格子理论数小于5,如果有1/5以上的格子理论数小于5或有理论数小于1时,需要:适当增加样本例数;理论频数太小的行或列与性质相近的邻行或邻列合并;删去理论频数太小格子对应的行或列。

②该资料χ2检验结果,如果有统计意义,并不表示任何两组之间差别都有统计意义。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈