统计推断理论

时间：2022-02-12 理论教育版权反馈

【摘要】：以该方法论的创立为标志，推断统计学派得以正式产生。从统计推断理论的产生与发展历程来看，统计推断的需求来自于我们不可能或者不必要对总体进行全面观察的事件。统计推断是从总体中抽取一部分样本，通过对样本进行调查，进而对总体做出估计与判断的一种统计方式。统计推断的基本问题可以分为参数估计和假设检验两类。

统计推断是按照随机性的原则，从总体中随机抽取样本进行调查，并依据统计推断理论，用样本数据来推断总体数据的方法。

（一）统计推断的产生与发展

在统计理论上，统计推断理论也称为推断统计学，其产生于20世纪20年代以后，其萌芽起源于戈塞特（William sealy Gosset），创始人是R·A·费雪（Ronald Aylmer Fisher），并经内曼（Jerzy Splawa Neyman）、 E·S·皮尔逊等人共同努力，得到了充实与发展。

1908年，英国统计学者戈塞特小样本理论以及t分布理论的提出，为利用样本数据来推断总体数据提供了一个新途径。

20世纪20年代，英国数理统计学家费雪针对戈塞特的论文，给出了t分布的数理论证，进一步提出了F分布的理论，并创立了利用样本数据来推算总体数据的统计方法论。以该方法论的创立为标志，推断统计学派得以正式产生。

在费雪之后，内曼、E·S·皮尔逊等人也为推断统计学发展开展了大量的工作。内曼的主要贡献是在“假设检验理论”和“区间估计理论”的创立方面，他与E·S·皮尔逊一起提出“内曼—皮尔逊理论”。后来，内曼又提出“区间估计理论”，亦称“信赖区间估计理论”。美国统计学家沃尔德（Abraham Wald）把现代数理统计学原有的估计理论和假设理论结合起来，形成了“决策理论”，从而扩大了统计研究的范围。美国统计学家威尔克斯（Samuel Stanley Wilks）继戈塞特、R·A·费希尔之后继续研究“样本分布理论”。加拿大统计学家弗雷泽（Donald Alexander Stuart Fraser）在1966年首次提出非参数统计方法。

（二）统计推断的基本思想

从统计推断理论的产生与发展历程来看，统计推断的需求来自于我们不可能或者不必要对总体进行全面观察的事件。例如，全部灯泡使用寿命的检验将失去所有灯泡的使用价值，对某城市所有居民家庭进行调查，将消耗大量人力、物力、财力等。

在此背景下，我们不能或不必要对总体进行调查，又要获取总体数据的情况下，我们应该怎样做才能够完成相应的调查任务呢？对此，推断统计理论认为，虽然我们不能对总体的全部单位进行调查，但我们总能对总体的部分单位进行调查，只要能够保障我们所调查的这部分单位对总体具有较高的代表性，则由这些单位所构造的样本数据特征也就反应总体的数据特征，从而也就可以用样本数据来推断总体数据。

推断统计理论进一步指出，用样本数据来推断总体数据，关键在于提高样本对总体的代表性，随机抽样不但可以为提高样本的代表性提供保障，而且可以为各种数理统计方法的应用搭建一个基本平台，使统计推断理论更为科学、有效。

（三）统计推断的基本范式

统计推断是从总体中抽取一部分样本，通过对样本进行调查，进而对总体做出估计与判断的一种统计方式。统计推断的基本问题可以分为参数估计和假设检验两类。

1.参数估计

参数估计是根据从总体中随机抽取的样本数据，来估计总体未知参数的方法。参数估计包括点估计和区间估计，其基本范式大体相同，都是首先根据研究的问题构造统计量，然后用构造的统计量来给出未知参数的估计。

2.假设检验

假设检验是根据一定假设条件由样本推断总体的一种方法。假设检验的基本范式包括建立假设、选择检验统计量，给出拒绝域形式、选择显著性水平、确定临界值，给出拒绝域和做出判断等。

（1）建立假设。在进行假设检验之前，首先确定原假设和备择假设，原假设就是要检验的假设，备择假设是原假设被拒绝时要接受的假设，原假设和备择假设的设定应依据所研究的实际问题，通常把没有充分理由就不能轻易否定的命题作为原假设，原假设与备择假设不能含有共同的参数。

（2）选择检验统计量，给出拒绝域形式。要判断原假设是否为真，需要构造一个统计量，用该统计量的分布来判断原假设的真假，这个统计量就称为检验统计量。确定检验统计量之后还应该给出接受域和拒绝域，接受域就是保留原假设的样本观察值所组成的区域，拒绝域是原假设被拒绝的样本观察值所组成的区域，接受域与拒绝域是互斥的，因此只要知道其一即可。

（3）选择显著性水平。因为对原假设是否为真的判断是依据样本做出的，因此，样本的随机性可能导致检验结果与实际不符，也就是检验是会犯错误的。通常称原假设为真，但是由于样本的随机性使样本观察值落入拒绝域，从而导致拒绝原假设的错误称为第一类错误；将原假设为假，但是由于样本的随机性使样本观察值落入接受域，从而保留原假设的错误称为第二类错误。人们希望犯第一类错误和犯第二类错误的概率都很小，但理论研究表明，第一类错误与第二类错误必然一小一大，只有当样本量不断增大时，犯两类错误的概率才会都变小，但在实际操作起来，这又是不现实的。因此，我们就采取了一个折中的办法，就是控制犯第一类错误的概率，但又不要使它过小，在控制犯第一类错误的概率中制约犯第二类错误的概率，此时犯第一类错误的概率就称为显著性水平，最常用的显著性水平为0.05，有时也可以取0.01或0.1。

（4）确定临界值，给出拒绝域。建立假设，确定检验统计量，给出拒绝域形式，并选择显著性水平之后就要确定临界值，给出拒绝域。

（5）做出判断。当样本落入拒绝域内时，就拒绝原假设，接受备择假设；当样本没落入拒绝域时，就不能拒绝原假设，从而保留原假设或简单地称为接受原假设。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈