首页 理论教育 数值型数据的图表展示

数值型数据的图表展示

时间:2022-02-14 理论教育 版权反馈
【摘要】:直方图的特点在于:横轴表示对数值型数据的分组区间,以矩形的面积表示频数的大小。茎叶图能够在展示频数的基础上让人直观地看到原始数据,但是不适合大量数据的展示。数值型数据可用直方图或茎叶图展示频数,也可以箱线图展示数据特征,对于时间序列数据可以用线图展示,而对于双变量数据的关系可以用散点图展示。

数值型数据比品质数据的计量尺度更高,因此数值型数据的图表展示有不同的方法。

3.2.1 数值型数据图表展示的方法

【例3‐2】 某电脑公司2005年前四个月各天的销售量数据如表3‐3所示(单位:台)。现需要以图形分析其特点。

表3‐3 销售数据

资料来源:贾俊平,何晓群,金勇进.统计学(第四版).北京:中国人民大学出版社,2009.

用图表展示数值型数据的方法可以基于频数用直方图(histogram)或茎叶图(stem‐and‐leaf)展示,也可以基于一些特征数据以箱线图(box plot)展示,对于某些特殊类型数据如时间序列数据可以用线图(line plot)展示,对于双变量数据的关系可以用散点图(scatter diagram)展示。

3.2.2 各图形的分析原理

3.2.2.1 直方图

直方图在表现上与条形图相似,是展示数据频数最常用的图形,如图3‐9所示。

直方图的特点在于:横轴表示对数值型数据的分组区间,以矩形的面积表示频数的大小。因为是连续分组,因而矩形总是“紧挨”在一起,这也是直方图和条形图的最大区别;当对数据进行等距分组时,矩形的高度可以表示频数。直方图绘图的关键在于分组,这一点可交由软件完成。

图3‐9 直方图

资料来源:http://baike.baidu.com/view/60840.htm。

3.2.2.2 茎叶图

茎叶图是由“茎”和“叶”的数字构成,反映频数的一类图形,其原理在于把数据的十位数、百位数等高位数作为茎,个位数作为叶的方法来展示某区间的频数。茎叶图能够在展示频数的基础上让人直观地看到原始数据,但是不适合大量数据的展示。如图3‐10所示。

图3‐10 茎叶图

资料来源:http://baike.baidu.com/view/634970.htm。

3.2.2.3 箱线图

箱线图是根据一组数据的5个特征值:最大值、最小值、中位数(数据排序后处于中间位置上的数)、下四分位数(数据排序后处于25%位置上的数)和上四分位数(数据排序后处于75%位置上的数)来展示数据,5个特征值作为5条线,2个四分位数构成箱体,异常值用小圆圈显示。如图3‐11所示。

3.2.2.4 线图

对于时间序列数据,可以用线图来展示,即在直角坐标系中以横坐标为时间,纵坐标为具体数据,将各数据点用折线连接起来的图形,如图3‐12所示。

图3‐11 箱线图

资料来源:http://baike.baidu.com/view/1326550.htm。

图3‐12 线图

资料来源:http://baike.baidu.com/view/1396532.htm。

3.2.2.5 散点图

散点图是展示两个变量关系的图形,其原理在于将2个变量分别作为直角坐标系的横纵轴,将数据用坐标点展示,所有数据的坐标点构成散点图,如图3‐13所示。

图3‐13 散点图

资料来源:http://baike.baidu.com/view/1323662.htm。

3.2.3 运用SPSS进行数值型数据的图标展示

例3‐2的数据在SPSS中需要以图3‐14所示的形式存放。直方图、茎叶图和箱线图的具体步骤如下:

图3‐14 SPSS中的数据存放形式

(1)单击“分析”→“描述统计”→“探索”,系统弹出如图3‐15所示对话框。

图3‐15 探索窗口

(2)把左框中的“sale”用箭头送入右边的“因变量列表”框中。

(3)指定选项:单击“绘制”按钮,弹出如图3‐16所示的“探索:图”对话框,选择“茎叶图”、“直方图”和“不分组”选项,单击“继续”回到主对话框。

(4)单击“确定”,得到直方图、茎叶图和箱线图,如图3‐17、图3‐18、图3‐19所示。

图3‐16 “探索:图”对话框

图3‐17 直方图

图3‐18 茎叶图

图3‐19 箱线图

【例3‐3】 根据我国1991—2003年城乡居民家庭的人均收入绘制线图,数据如表3‐4所示。

表3‐4 收入数据 单位:元

资料来源:贾俊平,何晓群,金勇进.统计学(第四版).北京:中国人民大学出版社,2009.

例3‐3的数据在SPSS中需要以图3‐20所示的形式存放。具体步骤如下:

(1)单击“图形”→“旧对话框”→“线图”,系统弹出如图3‐21所示的对话框。

图3‐20 数据存放

图3‐21 线图对话框

(2)选择“多线线图”和“各个变量的摘要”选项,点击“定义”。

(3)指定选项:将变量“city”、“rural”用箭头导入右侧“线的表征”框;将变量“year”用箭头导入右侧“类别轴”框,如图3‐22所示。

图3‐22 绘图对话框

(4)单击“确定”,得到线图,如图3‐23所示。

图3‐23 线图

【例3‐4】 根据某地降雨量和农作物产量的数据(见表3‐5),绘制散点图描述降雨量和农作物产量的关系。

表3‐5 降雨量和农作物产量数据

资料来源:贾俊平,何晓群,金勇进.统计学(第四版).北京:中国人民大学出版社,2009.

例3‐4的数据在SPSS中需要以图3‐24所示的形式存放。具体步骤如下:

图3‐24 数据存放

(1)单击“图形”→“旧对话框”→“散点/点状”,系统弹出如图3‐25所示的对话框。

图3‐25 散点图对话框

(2)选择“简单分布”选项,点击“定义”。

(3)指定选项:将变量“produce”、“rain”分别用箭头导入右侧“Y轴”和“X轴”框,如图3‐26所示。

图3‐26 散点图对话框

(4)单击“确定”,得到散点图,如图3‐27所示。

图3‐27 散点图

【本章小结】

本章介绍了品质数据和数值型数据的图表展示方法。

品质数据需要按类别展示各类别数据的频数,可以通过频数分布表和条形图或饼图展示。

数值型数据可用直方图或茎叶图展示频数,也可以箱线图展示数据特征,对于时间序列数据可以用线图展示,而对于双变量数据的关系可以用散点图展示。

阅读案例

市长支持率具有公众基础

政治改革日益深化之时,以人为本的行政理念已深入民心。对于城市市长的功过评价已不再局限于经济一环,科学发展观指导下的政绩观更具意义,市民对于市长行政表现的认可及普遍支持将是影响市长发展的重要因素。2008年5月,深圳市公布的改革纲要明确表示,要在以后条件成熟时进行市长差额选举,候选人要在一定范围内进行公开讲演、答辩,因此市民对于市长的支持将更具现实意义。

零点研究咨询集团自2002年起即致力于中国市长公众支持度实验性调查,连续调查发现:中国市长支持率总体较高,京沪两地市长表现更为突出,市长任期、行政表现及市民期望是市长支持率的重要影响因素;市长行政透明度及市民欣赏度是市长支持率提升的重要着力点,因此实现市民期望与价值尤为重要。

一、市长支持率总体较高,京沪市长表现突出

通过对2002—2008年中国七个城市市长支持率的比较研究(见图3‐28),可以看出:我国城市市长支持率总体上较高,尤其是北京和上海两地,市长支持率基本在60%以上,上海市长2007年支持率甚至高达79.2% 。由于中国社会目前正处于转型期,各城市面临诸多改革发展难题,牵涉的利益群体也十分复杂,因此市长的高支持率实属不易。

任期是市长赢取自身支持率的重要前提,任期较长的市长相对来说更容易保证政策的连贯性,市长支持率也更能够体现出真正的民意。以广州市市长为例,自2003年以来市长支持率基本表现出增长趋势,由47.6%上升至75.5% 。反之,因为政府任期届满而导致的人事变动则很容易对支持率产生负面影响,如北京新任市长2008年履新之后,其支持率跌至55.5% ,市长换届的影响显而易见。

当然,任期并不能最终决定市长支持率的高低,市民对于市长施政的期望值和市长的施政表现才是市长获得高支持率的重要因素。当市民期望值与市长施政表现契合时,市长支持率将走向新高并且具有稳定性;而当市长施政表现不能满足市民期望的时候,两者之间的反差往往会导致支持率出现波动甚至大幅下降。

其实市民对于市长支持率的衡量标准是动态变化的,市民将以城市发展重点或者热点话题的施政表现衡量市长的水平,并且会受到偶发事件的影响。市长在任期内对于某些问题处理的突出政绩或者工作不力都将对市长支持率产生直接影响。2003年非典肆虐,广州、武汉、成都等城市市长支持率普遍创下新低,2003年七个城市市长的总体支持率在2002—2008年期间也处于最低水平,与其他年份相差甚远。

图3‐28 2002—2008年七城市市长支持率比较

资料来源:零点研究咨询集团《2008年度市长公众支持度调查》。

二、实现市民期望与价值,以行政欣赏度赢取市长支持率提升

根据零点历年市长支持率的实验性调查(见图3‐29),市长行政内容透明度和受欣赏程度对于市长支持率有显著影响作用。其中,对市长支持率最具正面影响力的因素是了解并认同现任市长的表现,市民欣赏度对于市长支持率的提升力度高达26.7% 。

当然,透明度对于市长支持率的提升作用同样重要,提升力度也达到22.3% 。其实行政透明化是欣赏度的重要前提,也是市长获得支持的重要基础。许多城市实际上也采取了信息公开机制建设阳光型政府,通过市长信箱、市长电话等方式接受市民监督。对于行政事务一味地暗箱操作、内部决定,根本不可能得到市民欣赏,遑论市民支持,对于民主社会建设也将是一个退步。

2001年中国市长协会首次提出“经营城市”的全新概念,作为“经营者”,一个市长成功的标志就是最大限度地实现市民的期望与价值。调查显示,关心民众、为政清廉和实际政绩三个方面的欣赏度和透明度对于提升市长支持率的作用更为突出,尤其是关心民众的欣赏度。只有站在市民的角度,才能把行政职能与市民需要创造性地结合起来。

图3‐29 2008年市长透明度和欣赏度对于支持率的提升作用比较

资料来源:零点研究咨询集团《2008年度市长公众支持度调查》。

三、社会中坚对市长支持率更高,市民参与选举的意愿较高

交叉分析发现,市民的文化程度和年龄与市长支持率表现出相关性(见图3‐30),具有大学以上学历、31~45岁的市民对于现任市长的支持率更高。68.6%的大学以上学历的市民表示,如果选举将会投票给现任市长,其中15.4%表示肯定会;另外,65. 4%的青壮年市民对于现任市长持支持态度。相对于其他市民,社会中坚对于市长的认知相对更为充分,衡量标准也更为理性一些,因此这种高支持率相对比较客观。当然在这些支持者中不乏对市长一无所知的市民,这表明他们对于市长有着一种自动的心理支持机制,至少并不排斥现任市长,这也从侧面反映出他们对于生活的满意度。调查同时发现,近六成市民愿意参加投票选举市长,这是一个积极的信号。

图3‐30(a) 不同年龄市民对于市长支持率比较(%) 图3‐30(b) 不同学历市民对于市长支持率比较(%)

资料来源:零点研究咨询集团《2008年度市长公众支持度调查》。

由于选举机制与西方不同,目前市民支持率对于市长任命并不具有决定性意义,但这毕竟是民意的真实反映,也在客观上表明市民对于市长的期望与价值所在。而且一旦允许自主选举市长,市民较高的参与意愿也释放出一种积极的信号。因此市长在任期内通过向社会公开政务信息、官员财产申报制度等行政透明化举措,以及对城市发展的行政政绩,真正做到权为民所用、情为民所系、利为民所谋,将会自然得到市民的拥戴与支持。

技术说明:本项调查使用多阶段随机抽样方式,针对北京、上海、广州、武汉、成都、沈阳和西安七座城市18~60岁常住市民进行入户访问,数据结果已根据各地实际人口规模进行加权处理。2008年调查于9月中旬进行,对1533名常住居民进行了入户访问,在95%的置信度下调查的抽样误差为±1.39% 。

资料来源:上海财经大学《社会统计学》省级精品课程网站。

复习思考题

1.什么是频数与百分比

2.简述直方图与茎叶图的区别与联系。

案例分析

为了了解两个班级的统计学教学效果,获得两个班各50名同学的统计学成绩,如表3‐6和表3‐7所示。

表3‐6 甲班学生成绩数据

表3‐7 乙班学生成绩数据

续表

资料来源:贾俊平,何晓群,金勇进.统计学(第四版).北京:中国人民大学出版社,2009.

试运用直方图、茎叶图与箱线图分析比较两个班的成绩数据。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈