首页 理论教育 数据输入统计分析

数据输入统计分析

时间:2022-02-12 理论教育 版权反馈
【摘要】:对直方图进行曲线拟合,拟合所得到的曲线应该就是该随机变量的概率或密度函数。这是一种定性分析的结果。设某一个随机过程X,其n个抽样样本为x1,x2,…为了测试随机样本量为n的随机变量X服从某一特定分布形式的假设,常用C2拟合度检验。检验的统计量由下式给出。假设检验作零假设H0:观察值Xi是一组属于分组分布函数F的独立相同分布的随机变量。

对于离散系统的统计分析中,一般用频率统计的分析方法来计算分布函数。其图形描述用的就是直方图

1.直方图的建立步骤

直方图的建立步骤如下:

①取值区间划分:Pi=ni/N, ni=落在i区间中的次数;

②水平坐标轴的区间标注;

③计算确定每一区间内的发生数;

④垂直坐标轴上标注频数;

⑤绘制各个区间上发生的频数;

⑥绘制直方图。

2.直方图分组区间数量的选取

分组区间的组数依赖于观察次数以及数据的分散或散布的程度,如果区间太宽(m太小),则直方图太粗或呈短粗状,这样,它的形状不能良好地显示出来;如果区间太窄,则直方图显得凹凸不平不够平滑。

一般分组区间组数近似等于样本量的平方根,即:m=。合适的区间选择(m值)是直方图制作和分布函数分析的基础。

图4-1 直方图分组区间示例

对直方图进行曲线拟合,拟合所得到的曲线应该就是该随机变量的概率或密度函数。密度函数是一个一般概率函数。通常,我们通过标准函数的假设,将概率分布假设成标准分布函数形式,如负指数分布、泊尔松分布等。

3.参数估计

前面通过对随机过程的样本值的直方图分析,我们已经得到了随机过程的分布假设,即假设随机过程的概率分布符合某一种标准随机分布。这是一种定性分析的结果。在给定了一种随机分布函数后,需要进一步获取这一分布函数的特征参数,这一标准分布函数的参数需通过参数估计求得。因此,参数估计在这里是为了对随机分布函数参数求取的一个工具。

设某一个随机过程X,其n个抽样样本为x1,x2,…,xn,该样本的均值为=xi,该样本的方差为S2=。

如果离散数据已按频数分组,则:

  =fixi S2=

  式中,k:X中不相同数值的个数即分组数;

f:X中数值Xj的观察频数。

表4-1 仿真中常用的一些分布参数建议值

分 布

参 数

建议使用的估计量

泊尔松

a

=

指 数

λ

=

在(0,b)上的均匀分布

b

=xmax

正 态

μ,σ2

=,=S2

4.拟合度检验

(1)拟合度检验的统计量

为了测试随机样本量为n的随机变量X服从某一特定分布形式的假设,常用C2拟合度检验。这种检验方法首先是把n个观察值分成k个分组区间或单元。检验的统计量由下式给出(k为分布的阶数)。

  =∑

式中,Oi:在第i个分组区间的观察频数(Oi=ni/n);

Ei:在该分组区间的期望频数。每一分组区间的期望频数是Ei=npi,这里的pi是理论值,是对应第i个分组区间的假设概率。

(2)拟合程度的判定

可以证明近似服从具有自由度f=k-s-1的c2分布;这里s表示由采样统计量所估计的假设分布的参数个数。

假设检验作零假设H0:观察值Xi是一组属于分组分布函数F的独立相同分布的随机变量。若c2太大则拒绝H0,若拟合是好的,则期望值c2很小。

(3)拟合度检验步骤

①首先划分区间,定义k值;

②计算各组的观察频数;

③计算c0;

④查阅c2表,得到P值,该值反映的是假设分布的拟合程度。

(4)指定拟合度的检验

我们可以根据拟合度检验的要求,设定一个拟合度的显著性指数α,根据设定的显著性指数α以及χ2分布的自由度数f=k-s-1,可以查χ2表得到。

①如果kengdiegt;则检验未通过,H0不成立。

②如果≤则检验通过,H0成立。

在应用这个检验时,如果期望的频数太小,将对检验的有效性有所影响。一般情况下区间的个数k宜在30~40以下,并能使最小期望频数Ei≥5。如果Ei值太小,可以把它和相邻分组区间的期望频数相合并,对应的Qi值也应该合并起来,同时每当合并一个单元,k值应该减去1。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈