首页 理论教育 统计学基本知识

统计学基本知识

时间:2022-04-24 理论教育 版权反馈
【摘要】:例如,1个月中的手术患者数、1年里的新生儿数。“连续”是指该变量可以在实数轴上连续变动,由测量而得到。

一、统计学常用的几个概念

总体(population):表示大同小异的对象(某个测量值)全体。

样本(sample):从研究总体中随机抽取的一部分有代表性的个体,其实测个体数的多少称样本含量或样本例数。

同质(homogeneity):一个总体中有许多个体大同小异,存在共性,这些个体处于同一总体。

变异(variation):同一总体内的个体间存在差异。

参数(parameter):是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数(mean)和总体方差(variance)。

统计量(statistic):由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数、样本方差。

抽样(sampling):从研究总体中抽取一部分有代表性的个体的方法。

抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。

概率:是描述某事件发生可能性大小的量,用符号P表示,取值范围在0~1之间。概率是相对总体而言,属于参数。

频率:描述随机事件发生可能性大小的度量,是对样本而言的,用f表示。

小概率事件:统计学上常将P≤0.05或P≤0.01的事件称为小概率事件。

二、统计资料的类型及其特征

(一)变量的类型

变量(variable):分成定性(qualitative)与定量(quantitative)两种类型。

1.定性变量 分类变量(categorical variable)或名义变量(nominative variable)。分为二分类变量、多分类变量、有序变量。

(1)二分类变量(binary variable),称为0-1变量。例如,性别(男女)、疾病(有无)和结局(生死)等。二分类变量常用0和1来编码,0-1变量常称为假变量(dummy variable)或哑变量,可以和真变量一样参与计算。

(2)多分类变量,如血型:A、B、AB、O等。

(3)有序变量(ordinal variable)或等级变量。分类变量的“取值”中自然地存在着次序。例如,问卷调查常问对某件事情的满意程度:极不满意、有点满意、中度满意、很满意、极满意。有些临床体检或实验室检验常用-、±、+、++和+++来表示测量结果。

2.定量变量分为离散型变量、连续型变量

(1)离散型变量(discrete variable):只能取整数值。例如,1个月中的手术患者数、1年里的新生儿数。

(2)连续型变量(continuous variable):可以取实数轴上的任何数值。“连续”是指该变量可以在实数轴上连续变动,由测量而得到。例如,血压、身高、体重等。

(二)各类资料的特征

1.定量变量特征 有度量衡单位;多为连续型变量,可以带小数或整数;统计指标常为集中趋势与离散程度指标,如平均数、标准差等;统计分析方法有t检验、方差分析、相关与回归等。

2.分类变量特征 不带度量衡单位;资料数据均为整数;统计资料常用相对数、比率、构成比等;统计分析方法如卡方检验等。

3.有序变量特征 与分类变量不同,属性的分组有程度的差别,各组按大小顺序排列;它与定量变量资料不同,每个观察单位虽有数量上的差别,但不确切,因此又称为半定量资料;有序变量的分析方法常用秩和检验方法等。

注意:应分清资料的性质,结合实验设计方法,选用相应的检验方法。

三、统计工作的步骤

第1步:实验设计。

第2步:收集资料。

第3步:整理资料。

第4步:分析资料,包括统计描述(统计指标、统计表、统计图);统计推断,由样本统计量推断出总体参数(参数估计、假设检验);专业分析,选用适当统计分析方法。

四、死亡率、病死率、发病率与患病率

1.死亡率(mortality rate) 指某地某年平均每千人口中的死亡数,它反映居民总的死亡水平。

2.病死率(case fatality rate,CFR) 指在特定时间(1年)内患某病者因该病死亡的百分比,可说明一种疾病的严重程度,也可反映一个医疗单位医疗水平和质量。

3.发病率(incidence rate,IR) 表示一定时期内,在可能发生某病的一定人群中新发生某病的强度。

4.患病率(prevalence rate,PR) 又称为现患率,指某时点上受检人数中现患某种疾病的频率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈