首页 百科知识 城乡家庭收入分布函数拟合和检验

城乡家庭收入分布函数拟合和检验

时间:2022-07-11 百科知识 版权反馈
【摘要】:在国外,意大利经济学家帕累托首次研究了收入的分布规律,发现收入分布服从幂率分布。本书拟采用这一思想,对我国城乡家庭人均收入分布做一个拟合,经过反复验证发现:高收入阶层可用帕累托分布拟合;中等收入分布可用对数正态分布拟合;低收入分布可用指数分布拟合。

在国外,意大利经济学家帕累托(Pareto)首次研究了收入的分布规律,发现收入分布服从幂率分布。随后的大量实证研究结果表明高收入阶层的收入分布可以用幂率分布描述,而中低收入阶层的收入分布可以用对数正态分布或指数分布描述。本书拟采用这一思想,对我国城乡家庭人均收入分布做一个拟合,经过反复验证发现:高收入阶层可用帕累托分布拟合;中等收入分布可用对数正态分布拟合;低收入分布可用指数分布拟合。帕累托分布是收入分配理论中一种重要的分布(Cowell,2000)。帕累托分布的累积分布函数为:其中,α是形状参数,θ是尺度参数(门限参数)。累积分布函数度量收入小于等于θ的相对人口比例,我们将这两参数帕累托分布记为Pareto(θ, α)。因为帕累托分布的参数严格为正,仅有右尾,而且尾部比对数正态分布厚,在实证上能很好地拟合高收入阶层。在实证过程中,如果所得模型的平均方差(Average Variance,AV)远远超过均方误差(Mean Square Error,MSE),则数据的拟合效果好(彭昭英,2000)。

正态分布的概率密度函数为:其中,μ和σ分别是随机变量X的均值与标准差,我们记为N(μ,σ)。在实证过程中,根据样本数据分布的形状和正态分布相比较,得出一个数值P(0<P<1,即实际的显著性水平)来描述“数据分布服从正态分布”的拟合程度,由于中等收入的城乡家庭数目小于2000户,所以用W[2]统计量检验中等收入阶层的对数收入分布是否符合正态分布。如果W统计量的P值大于0.05,则样本分布通过正态性检验。

指数分布是一种连续概率分布,由于城乡家庭人均收入大于等于0,因此它的累积分布函数为:

F(x)=1-e-λx,x≥0(3.3)

其中,λ是指数分布参数,我们记指数分布为Exp(λ)。在实证过程中,我们以参数λ的P值来检验估计参数λ的显著性,如果参数估计的P值小于0.05,则拒绝“参数λ=0”的原假设,参数λ的估计值在5%水平下显著。

首先确定城市和农村家庭低、中、高收入阶层的分界线。利用“交叉验证法”(赵桂芹,2008)得到帕累托分布的门槛值xg,即城市和农村高收入家庭的最小值,根据门槛值xg所处位置可以计算得到城市和农村高收入家庭数目占整个城市和农村家庭数目的比例θ;从城市和农村概率分布图中得到门槛值xg的概率Pg以及概率最大的值x0后,根据正态分布的对称性,以x0为对称中心,在x0的左端找到概率同样为Pg的数值xd,以xd所处位置作为中等收入和低收入阶层的分界点,由此可以分别计算得到城市和农村中、低收入家庭数目占整个城市和农村家庭数目的比例β和α。

接下来,分别利用帕累托分布函数、对数正态分布函数和指数分布函数对城市和农村家庭人均收入的高、中、低收入阶层进行拟合。我们发现每个帕累托模型的平均方差远远超过均方误差,数据的拟合效果好,每年城市和农村中等收入阶层的家庭人均对数收入数据都通过正态性检验,指数分布模型的参数估计结果均在显著性水平5%上显著(见表3.1)。因此,由城市家庭人均收入分布函数公式Fu=αF1+βF2+θF3可分别得到1989—2011年的城市家庭人均收入分布函数Fui(i表示年份)。

表3.1 1989—2011年我国城市和农村各收入阶层的分布检验

表3.2 1989—2011年我国城市和农村家庭各收入阶层的分布函数

(续表)

注:α,β,θ分别表示低、中、高三个收入层次的家庭数目占城市(农村)家庭数目的比例。

同样,由农村家庭人均收入分布函数Fr=αF1+βF2+θF3可分别得到1989—2011年农村家庭人均收入分布函数Fri(i表示年份)。进一步,利用分布函数法可以分别得到1989—2011年的城乡混合家庭人均收入分布函数(见表3.2):

Fmi=γiFui+(1-γi)Fri(3.4)

其中,Fmi表示城乡混合家庭人均收入分布函数;Fui表示城市家庭人均收入分布函数;Fri表示农村家庭人均收入分布函数;i表示年份,γi表示i年城市家庭数目占全国家庭总数目的比例。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈