首页 理论教育 数据的概况性度量

数据的概况性度量

时间:2022-02-14 理论教育 版权反馈
【摘要】:通过本章学习,了解数据特征测度的意义和描述方法;熟练掌握集中趋势、离散程度各测度值的计算方法,以及不同方法的特点和应用场合;了解峰态与偏态系数的计算方法,掌握系数的应用方法。在处理诸如人类特征的数据时,各种平均数的数值十分接近。数据特征的概况性描述,主要包括三方面内容:集中趋势的度量、离散程度的度量及偏态与峰度的度量。

【教学目标】

通过本章学习,了解数据特征测度的意义和描述方法;熟练掌握集中趋势、离散程度各测度值的计算方法,以及不同方法的特点和应用场合;了解峰态与偏态系数的计算方法,掌握系数的应用方法。

【教学要求】

【导入案例】

“平均数”与数据分布

很多情况下,各种类型平均数的数值十分接近,如果出于一般的目的,根本没有必要区分它们。

比方说,当你看到某个原始部落男性的平均身高为5英尺时,你对这些人的外形条件就能有很好的了解,根本不需要进一步询问这个平均数是均值、中位数或者众数,因为此时各种平均数的数值大致相等(当然,如果你正在为非洲人赶制一批制服,那么就需要比平均数更多的信息,你要用到全距和标准差)。

在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点,在你用曲线绘制正态分布时,将看到一根钟形的曲线,均值、中位数和众数都落在相同的点上。

在描述人类身高时,用哪种平均数无关紧要,但在描述他们钱袋子的时候,却不是那么回事儿了。如果把某个城市所有家庭的年收入都列出来,你会发现,这些数从很小的值变动到很大的数,也许有20000英镑左右,甚至还能看到少数巨额收入。年收入低于5000英镑所占的比例超过了95% ,在收入曲线上朝左边拖出了一条长长的尾巴。这种分布不再像钟形一样对称,而是有偏的,它的形状类似于孩子玩的滑梯,梯子一侧陡斜地升到顶部,而滑道一侧则缓慢向下倾斜。均值与中位数相差甚远,这样一来,比较上一年的“平均数”(均值)与今年的“平均数”(中位数),这种比较的有效性就不言而喻了。

资料来源:上海财经大学《社会统计学》省级精品课程网站(有删改)。

通过调查或实验获得的数据,经过整理后已经可以反映出被研究对象的一些状态与特征,但认知程度还比较肤浅,反映的精确度不够。因此,我们需要使用各类代表性的数量特征值来准确地描述这些数据。数据特征的概况性描述,主要包括三方面内容:集中趋势的度量、离散程度的度量及偏态与峰度的度量。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈