首页 理论教育 统计分析及其过程概述_福建教育发展研究

统计分析及其过程概述_福建教育发展研究

时间:2022-07-03 理论教育 版权反馈
【摘要】:在对数据进行统计分析之前,检验其是否符合正态分布是首要前提。2.相关系数计算与多重线性回归分析经验和常识告诉我们,某个事物的变化发展多数情况下决定于不止一个因素,而是可能有多个因素对其产生作用和影响的结果。如GDP与财政总收入,它们都会对教育的发展有一定影响,但同时它们二者本身就存在密切关系或者相互依赖。本研究先利用经验初步判断,并删除不重要的自变量减少重复信息。

统计分析及其过程概述_福建教育发展研究

二、统计分析及其过程概述

为统计分析与研究,收集了2000—2010年有关高等教育事业发展的数据资料,其中包括地区生产总值、人均GDP、财政总收入、预算内教育经费、城镇居民人均可支配收入、农民人均纯收入、高等教育适龄人口数(18—22岁)、高校专任教师数、高校校舍建筑面积、普通高校和成人高校在校生数和招生数、普通高中和中专在校生和毕业生数等等,在Microsoft Excel上建立了相关数据表,并进行了初步的整理,根据上述数据综合计算出了高教在学生、高校招生数和在校生数、高中中专毕业生和在校生数等等。(参见附件1)

1.曲线参数估计与一元线性分析

散点图,进行线性趋势判定。根据2001—2010年高等教育毛入学率发展变化的散点图(参见图3)可知,历年高等教育估算入学率发展变化呈现的是一条随时间变化逐步上升的曲线。在对数据进行统计分析之前,检验其是否符合正态分布是首要前提。先应用SPSS进行了正态分布检验,数据基本符合正态分布。说明数据点列呈线性分布,可以进行线性回归。

图3 2001—2011年福建高校毛入学率变化趋势散点图

接着,为探索此曲线变化发展的规律,应用SPSS中的曲线参数估计(Curve Estimation)模块进行多种曲线模型拟合,包括线性模型(linear)、对数曲线模型(logarithmic)、逆曲线模型(inverse)、二次曲线模型(quadratic)、三次曲线模型(cubic)、幂函数模型(power)、混合曲线模型(compound)、S曲线模型、Logistic曲线模型、成长曲线模型(growth)和指数曲线模型(exponential)等,根据曲线参数估计结果(附件2),我们发现其中的线性模型、二次曲线模型和三次曲线模型的拟合度较好(图4)其确定系数R2均达0.99以上。

图4 多种曲线模型拟合示意图

为了更有效地对未来的目标参数进行预测,根据初步的预测结果和实际经验对三个曲线模型进行判断,从中发现,虽然三次曲线模型的确定系数R2最好,但与其他两模型相差仅0.006,而线性模型的方差F最大,故选定具有最佳预测功能的线性模型,(参见表6)并根据该数学模型做出2012年至2020年高等教育毛入学率的预测,最后,将各年的预测值与当年的高等教育适龄人口相乘,得出各年的高等教育在学生人数。(参见表2)

表6 三种曲线数学模型及各自的确定系数、方差对比

(注:Y为高等教育估算入学率,t为时间变量,当t=1时,年份为2001。)

由于高校招生数与高考在学生有很高的相关关系,研究中又以高教在学生为自变量,以高校招生数为因变量,利用SPSS的一元回归分析模块求出数学模型,(附件3)然后将已经测算出来的2012年至2020年的高教在学生数输入方程,计算出了今后的招生数预测值(参见表3)。

2.相关系数计算与多重线性回归分析

经验和常识告诉我们,某个事物的变化发展多数情况下决定于不止一个因素,而是可能有多个因素对其产生作用和影响的结果。用数学语言来说,就是因变量的变化多数情况下不是由一个自变量,而是由两个或两个以上的自变量对其变化产生影响。为了了解与高等教育的事业发展主要表征——毛入学率、招生数和在校生数的变化与多少的影响因素,这些影响因素究竟各有多大的相关性,以及对之产生最主要影响的因素是哪些,有必要进行与之有关的因素的相关系数分析与多重线性回归分析。

首先,根据定性分析的办法,从需求和供给等方面尽可能多地列出与高等教育毛入学率、招生数和在校生人数变化有关或可能制约因素,即备选变量。它们分别是:

经济因素:各年的地区生产总值(GDP)、人均地区生产总值、财政总收入、预算内教育经费、城镇居民人均可支配收入和农民人均纯收入等等;

社会因素:高等教育适龄人口数(18—22岁)等等;

高等教育因素:高校专任教师数、高校校舍建筑面积、普通高校和成人高校在校生数和招生数等等;

预备教育因素:高中阶段入学率、普通高中和中专招生数、在校生和毕业生数等等。

接着,对所得到的变量数据进行相关分析,求出它们之间的两两相关系数,即相关关系的强度,并进行显著性检验,以确定有多大的把握来说明它们之间存在相关关系。(附件4)根据相关系数的一般判断标准,排除了一些相关系数较低的因素(本研究中一般只保留了相关系数高于0.9的因素,参见表4),并对相关系数的显著性进行了检验。根据需要,在相关系数计算中仅计算了线性相关,并未进行自相关和偏相关的分析,这部分的工作留待下面的多元线性回归分析。

仅仅求出相关系数是不够的,还需要了解这些相关的因素中哪些是主要的、有决定作用的,以及它们与入学率(因变量)的具体数量关系是什么,因此接下来的工作就是多元线性回归分析以建立数学模型。

在进行多元回归分析中,一个重要的问题就是解决各个解释变量,即自变量之间的多重共线性问题。教育发展或规划是非实验型科学,有关教育发展变化往往是经济、社会与教育等等多种因素(解释变量)共同作用结果。而在最初收集到的变量中,有些作用于教育发展的各要素之间又是本身相互影响相互制约的,在数量关系上也会存在一定联系或相关关系。如GDP与财政总收入,它们都会对教育的发展有一定影响,但同时它们二者本身就存在密切关系或者相互依赖。这就是多重共线性。自变量之间存在共线性,说明自变量所提供的信息是重叠的,如果把它们都纳入回归模型中,就会使模型的检验可靠性降低,甚至可能反而将重要的解释变量舍弃。

SPSS在解决多重共线性方面比较复杂且有一定难度。本研究先利用经验初步判断,并删除不重要的自变量减少重复信息。如做出自变量间的相关系数矩阵(附件4),对其中相关系数超过0.9的变量进行分析筛选。

其次,利用逐步回归法(Stepwise Regression)、后向消去法(Backward Elimination)和前向逐步法(Forward Selection)三种方法对数据进行处理,然后进行比较,以消除多重共线性、选取“最优”回归方程。具体步骤如图5。

图5 多元线性回归分析流程图

利用SPSS的“线性回归分析”模块,输入所有的备选变量,要求计算机按三种方法进行变量的取舍,然后建立了三个线性回归方程。

根据逐步回归法建立的数学模型(附件5):

Y=6.390+0.001X1

(Y:高教毛入学率;X1:财政用于教育事业费用;X2:普高毕业生数)

根据后向消去法建立的数学模型时,SPSS提出警告,指出带有自变量毛入学率的最终数学模型,由于协方差矩阵异常,导致统计表不能计算。故不采用。

根据前向逐步法建立的数学模型:

Y=6.390+0.001X1

(Y:高教毛入学率;X1:财政用于教育事业费用;X2:普高毕业生数)

三个方程中有两个是一致的,故采用此模型。由这个方程,如果有相应的自变量预测值的话,也可以进行预测。并进行相应的指标预测估计。

其次,依照上述同样的原理,还对高校招生数进行多重线性回归分析,选定数学模型,从这个模型中,也可以了解对高校招生数变化贡献较大的三个自变量。

根据逐步回归法建立的数学模型:

Y高校招生数=3.480+0.314X1+0.118X2

(Y:高校招生数,即普通高校招生数和成人高校招生数之和;X1:高中毕业生数,即普通高中和中专学校毕业生数之和;X2:普通高校在校生数)

根据后向消去法(Backward Elimination)建立数学模型时,SPSS未见计算出各变量的t、sig值和偏相关系数,故不予采用。

根据前向逐步法建立的数学模型(附件6):

Y高校招生数=3.480+0.314X1+0.118X2

(Y:高校招生数,即普通高校招生数和成人高校招生数之和;X1:高中毕业生数,即普通高中和中专学校毕业生数之和;X2:普通高校在校生数)

前向逐步法与逐步回归法一致,故采用此模型。

参考文献

1.《福建统计年鉴—2011》中国统计出版社2012年版。

2.福建省教育厅编:《福建省教育统计简明资料》(2000—2010年)。

3.邵志芳:《心理与教育统计学》,上海科学普及出版社出版。

4.冯力:《回归分析方法原理及SPSS实际操作》,中国金融出版社出版。

5.林杰斌、陈汀、刘明德编著《SPSS11统计分析实务设计宝典》,中国铁道出版社出版。

6.张文彤主编:《SPSS11统计分析教程》(高级篇),北京希望电子出版社出版。

7.李志辉、罗平主编:《SPSS for Windows统计分析教程》(第2版),电子工业出版社出版。

附件1 福建教育发展若干相关数据—览表

注:本表数据,“预算内教育经费”来自福建省教育厅、省财政厅、省统计局相应年份教育经费执行情况的通报,“校舍建筑面积”来自相应年份福建省教育厅《教育统计简明资料》,其余均来自《福建统计年鉴—2011》。(为节省篇幅,附件2至附件5略)

【注释】

[1]表中预测数据,由福建省教育厅规划处提供的2000—2011年福建高教毛入学率计算。

[2]所谓“高教在学生”包括普通高校在校生、成人高校在校生和接受非学历高等教育的学生数,下同。

[3]高校招生数为普通高校招生数加上成人高校招生数,不含非学历高等教育的招生。数据来自《福建统计年鉴—2011》,福建省统计局网站,http://www.stats‐fj.gov.cn/tongjinianjian/dz2011/index‐cn.htm。

[4]表中“平均每一专任教师负担学生数”来自《福建省统计年鉴—2011》;“人均校舍建筑面积”数据是将相应年份的《福建省教育统计简明资料》“高等学校办学条件一览表”的“校舍建筑面积”÷《福建省统计年鉴—2010》中的“普通高校在校生数”+“成人高校在校生数”。

[5]《福建统计年鉴—2011》,表7—4:“城镇居民人均消费支出”,表7—13:“农民人均生活消费支出”。

[6]吴琼:“高等教育大众化背景下个人教育投资收益与风险”,百度文库,http://wenku.baidu.com/view/f640ec4bcf84b9d528ea7a5d.html。

[7]“高校招生数翻倍,教师在哪里?”《文汇报》2010‐03‐12。

[8]《福建统计年鉴—2011》,表16‐12:“主要年份教育基本情况”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈