首页 理论教育 多个样本均数分析方法

多个样本均数分析方法

时间:2022-03-02 理论教育 版权反馈
【摘要】:④样本的统计指标称为统计量。2.医学统计工作的基本步骤 可分为实验设计、搜集、整理和分析资料。这种由于抽样引起的样本统计量与总体参数之间的差异称为抽样误差。用以表示某事物内部各构成部分所占的比重。医学统计学方法近10年以来共考过42题,其中基本概念与基本步骤11题,数值变量数据的统计描述5题,数值变量、数据的统计推断17题,分类变量资料的统计推断4题,直线相关和回归2题,统计表和统计图2题。

一、基本概念和基本步骤

1.统计学中的几个基本概念 ①根据研究目的确定的、同质的全部研究对象称为总体,分为有限总体和无限总体,根据随机化的原则从总体中抽出的有代表性的一部分观察单位组成的子集称作样本,抽取样本的过程称为抽样。②除了实验因素外,影响被研究指标的非实验因素相同被称为同质。在同质的基础上被观察个体之间的差异被称作变异。③总体的统计指标称为参数。④样本的统计指标称为统计量。⑤观察对象的特征或指标,分为定性(分类)变量和定量(数值)变量两种类型。测量的结果被称为变量值或观察值。⑥描述随机事件(如发病)发生可能性大小的度量为概率,常用P表示。P值的范围在0和1之间,P≤0.05或P≤0.01的随机事件,通常称作小概率事件。⑦误差:为测得值与真值之差。可分为系统误差、随机测量误差和抽样误差。从同一总体中抽样,得到某变量值的统计量和总体参数之间有差别,被称为抽样误差。

2.医学统计工作的基本步骤 可分为实验设计、搜集、整理和分析资料。4个步骤互相联系,缺一不可,其中设计是最关键的一环。

二、定量资料的统计描述

1.集中趋势指标 ①算术均数,简称对数(mean)。习惯上以表示样本均数,以希腊字母µ表示总体均数,表示样本均数。均数适于对称分布,特别是正态或近似正态分布的计量资料。②几何均数,适用于对数正态分布资料或等比级数资料。③中位数,适用于任何分布类型的数值变量资料,常用于描述偏态分布资料、一端或两端无界的资料、频数分布类型不清楚的集中趋势。

2.离散趋势指标

(1)极差:也叫全距(R),是一组资料的最大值与最小值之差,适用于任何分布类型的资料。

(2)四分位数间距(Q):常用于描述偏态分布以及分布的一端或两端无确切数值资料的离散程度。

(3)方差:适用于正态和近似正态分布资料。

(4)标准差:标准差的应用。①说明观察值离散程度的大小。②与均数一起描述正态分布资料的特征。③计算变异系数。④计算标准误差

(5)变异系数(CV):常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异度。

三、定量资料的统计推断

1.均数的抽样误差

(1)在遵循随机化原则的前提下,由样本算得的统计量与总体参数之间仍存在差异。这种由于抽样引起的样本统计量与总体参数之间的差异称为抽样误差。

(2)样本均数的标准差(亦称标准误)是说明均数抽样误差大小的指标。由于实际工作中σ往往是未知的,可用样本标准差s作为σ的估计值,计算标准误的估计值。

2.总体均数可信区间及其估计方法 可信区间的定义:从总体中作随机抽样,根据每个样本可算得一个可信区间。如95%可信区间,意味着做100次抽样,算得100个可信区间,有95个可信区间包括总体均数(估计正确),只有5个可信区间不包括总体均数(估计错误)。估计方法如下。

(1)σ已知时,总体均数µ的95%可信区间为:,99%可信区间为:。

(2)σ未知,但样本例数n足够大时,总体均数µ的95%的可信区间为:,99%的可信区间为:。

(3)σ未知,样本例数较小时,总体均数µ的95%的可信区为:,99%的可信区间为:。

3.t检验 t检验的应用条件是样本含量较小,两组观察值的标准差相差不太大。样本含量较大时,样本均数的分布服从正态分布(u分布),可用u检验。①小样本均数与总体均数比较的t检验;②两个小样本均数比较的t检验;③配对资料的t检验。

四、分类变量资料的统计描述

常用相对数的种类

(1)率:又称频率指标,指在大量观察的基础上,某现象实际发生数与可能发生该现象总数之比。用以说明某现象发生的频率或强度。

(2)构成比:又称构成指标,为事物内部某组分例数与该事物各组分总例数之比。用以表示某事物内部各构成部分所占的比重。

(3)相对比:指两个有联系的指标之比,常以百分数或倍数表示。两指标可以性质相同,也可以性质不同。

五、分类变量资料的统计推断

1.率的抽样误差 从同一个总体中随机抽出观察例数相等的多个样本,样本率与总体率、各样本率之间往往会有差异,这种差异被称作率的抽样误差。率的抽样误差用率的标准误表示,计算公式为:αP=π(1-π)/n。

2.总体率的可信区间 需要按一定的概率100(1-α)%估计总体率所在的范围,该范围被称为总体率的可信区间。

3.X2检验 X2检验可用于两个及两个以上率或构成比的比较;两分类变量相关关系分析。其数据构成,一定是相互对立的两组数据,四格表资料自由度V永远=1。

六、统计表和统计图

1.统计表的基本结构和要求 统计表外观由标题、标目、线条、数字和备注等部分组成,有简单表和复合表,其中:①标题位于表的上端中央,简要说明表的主要内容,必要时注明时间和地点;②标目分纵标目和横标目;③线条越少越好,一般除表的顶线、底线,纵标目下和合计行上的横线条外,其他线条一般应略去,统计表两侧的封口线和表中斜线一律不用;④数字表内一律用阿拉伯数字;⑤备注不列入表内,如需特别说明时,应将说明内容用※“”标出,在表下做解释。

2.统计图型类型  常见的统计图有直方图、累计频率分布图、箱式图、直条图、百分条图、圆图、线图、半对数线图、散点图和统计地图等。

3.统计图型的选择 可根据以下原则选择合适的图形:①资料是连续性的,目的是用线段升降表达事物的动态变化趋势,选择普通线图。②资料是连续性的,但分析目的是用线段升降表达事物动态变化的速度,选择半对数线图。③数值变量的频数表资料,其分析目的是用直方的面积表达各组段的频数或频率分布情况,宜选择直方图。④资料是相互独立的,目的是用直条的长短比较数值的大小,选用直条图。⑤事物内部各部分的百分构成比资料,目的是用面积大小表达各部分所占的比重大小,则应选择圆形图或百分直条图。⑥双变量连续性资料,目的是用点的密集程度和趋势表达两个变量的相互关系,选用散点图。

4.制图通则 ①应根据资料的性质和分析目的选择适当的统计图,方能正确、直观地表达事物的数量关系。②标题应简明扼要反映统计图的主要内容,必要时可注明时间、地点和单位。统计图标题一般放在统计图的正下方。③统计图纵、横轴应有标目和单位。横轴尺度应自左向右,纵轴尺度应自下而上。纵、横轴的比例以5∶7或7∶5为宜。④若在同一统计图中表示不同事物或现象时,可采用不同颜色或图案,并应附有图例说明。

历年考点串讲

医学统计学方法近10年以来共考过42题,其中基本概念与基本步骤11题,数值变量数据的统计描述5题,数值变量、数据的统计推断17题,分类变量资料的统计推断4题,直线相关和回归2题,统计表和统计图2题。出题重点为统计学的基本概念、基本步骤,数值变量、数据的统计推断。形式多为概念术语和统计学的应用。常考的细节如下。

1.误差可分为系统误差、随机测量误差和抽样误差。

2.医学统计工作的基本步骤可分为设计、搜集、整理和分析资料。

3.概率是描述某随机事件发生可能性大小的指标。

4.可以全面描述正态分布资料特征的两个指标是均数和标准差。

5.反映一组观察值离散程度最好的指标是标准差。

6.若偏态分布资料一端或两端无确切的数值,描述其集中趋势指标是中位数。

7.统计学中所说的样本是指从总体中随机抽取有代表性的一部分

8.描述某种事物或疾病发生严重程度的指标是率。

9.两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为变异系数。

10.例题一:统计学检验的无效假设应是:H0∶π1=π2=π3=π4=π5

11.例题二:对10名25岁以上的山区健康男子测量脉搏次数(次/分),用t检验与全国正常男子资料进行比较,按a=0.05的检验水准,自由度为V=19。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈