随机抽样序列和随机数

时间：2024-08-24 百科知识版权反馈

【摘要】：通常把由已知分布的总体中产生的简单样本称为已知分布的随机抽样，简称为随机抽样。因而，我们首先要研究的是随机抽样序列和随机数。当使用多个随机数序列时，也可以定义任意符号来表示随机数。如果将一系统随机数整理成表就叫随机数表。因而，常把用这样的方法得到的随机数称作伪随机数。首先，对随机数抽样值进行分组。对于随机抽样结果，除了进行参数检验和分布均匀性检验外，还有独立性检验。

从上节的叙述中可以看到，如何从已知的总体中抽取简单样本是数字仿真法的基本问题。通常把由已知分布的总体中产生的简单样本称为已知分布的随机抽样，简称为随机抽样。

若随机变量ξ具有已知分布F（x），由总体ξ产生的容量为N的简单样本是x1，x2，…， x N。根据简单样本的定义，随机变量x1，x2，…，x N相互独立，且具有相同的分布F（x）。

不管抽取由什么样分布形式的总体所产生的样本，产生随机数序列都是最基本的工作。所谓随机数序列就是由在[0，1]上服从均匀分布的总体所产生的样本，而其中每一个“个体”均称为随机数[1]。

随机数序列的重要意义在于，它不仅是[0，1]上均匀的随机抽样的结果，而且更重要的是其他各种分布的随机抽样的基础。因而，我们首先要研究的是随机抽样序列和随机数。为了叙述方便，可以用专门的符号η1，η2，…，ηN来表示随机数序列，用ηi（i=1，2，…，N）来表示随机数。当使用多个随机数序列时，也可以定义任意符号来表示随机数。

产生随机数的方法有很多，最原始的方法是随机数表法。最简单的随机数取法是从0， 1，…，9等十个数字中，以等概率相互独立地从中抽取一个。如果将一系统随机数整理成表就叫随机数表。若要得到n位有效数字的随机数，只需将表中的n个相邻数字合并在一起，并用10n来除，就可以得到相互独立的以等概率（1/10n）出现的随机数序列。

现代数字仿真都是在计算机上进行的，此时随机数表就不太适宜。因为此时或是将随机数表装入内存而占去大量的内存单元，或是一次一次从外存中读取而耗费太多的机时。因而，这种方法已逐渐被淘汰。然而，在一般数字仿真中往往要进行人工试算和估算，此时从随机数表中取得随机数是比较方便的。

产生随机数的另一种方法是物理方法。它是在计算机上装一台物理随机数发生器，把具有随机性质的物理特征直接在机器上变成随机数字。常用的物理随机数发生器有以放射性物质作为随机源放射型随机数发生器和以电子管或晶体管的固有噪声作为随机源的噪声型随机数发生器。这样做可以在计算机上得到真正的随机数，但它带来了新的问题。由于这种随机过程一去不复返，不可能重复出现，因而无法再用原来的随机数进行试算或检查，并且对于设备的要求较高。这样就大大降低了这类方法的使用价值。

目前使用较广、发展较快的取得随机数的方法是数学方法。它是利用数学递推公式来实现的。因而，常把用这样的方法得到的随机数称作伪随机数。由于这种方法属于半经验性质，因而只能近似地具备随机性质。但是只要发生伪随机数的递推公式选择得比较好，由此产生的伪随机数的相互独立性是可以近似地得到满足，而且可以保证所得到的随机数的循环周期足够长。对伪随机数的最大容量（对应于循环周期）、独立性及均匀性的理论定量分析表明，递推公式及其有关系数的选择是否适当是极为重要的。

乘同余方法和乘加同余方法是目前广泛使用的伪随机数产生方法。

1）乘同余方法[2]

乘同余方法的一般形式为，对于任一初始值y1，伪随机数序列由下面递推公式确定：

式中：a称为乘因子；x0称为初始值或种子，M称为模，均为非负整数。

当给定一个初值y0后，就可以用式（7-17）递推出一系列随机数ηi（i=0，1，2，…， N），具体做法是，由a乘y0得到c0，c0被M除后所得余数即为y1，再将y1用M除后即可得到随机数η1。如此重复下去即可得到随机序列（η1，η2，…，ηN）。

一般来说，M要充分大，所得到的伪随机数的周期才有可能足够长。经验表明，a、M、y0取下列组合时可以得到较为满意的结果：

y0=1，a=515，M=256

y0=4m+1，a=515，M=254（m为正整数）

y0=773311，a=655393，M=33554432

y0=8388605，a=2045，M=8388606

2）乘加同余方法

乘加同余方法的一般形式为，对于任一初始值x1，伪随机数序列由下面递推公式确定：

式中：a称为乘因子；c为常数；x0称为初始值或种子；M称为模，均为非负整数。

抽样时参数选择不同，所抽取的随机数的质量也不一样[3]。因而，不管用哪一种方法来产生伪随机数序列都必须进行统计检验，以确信它们具有良好的统计特性。常用的检验方法有参数检验和均匀性检验。

1）参数检验

所谓参数检验，指的是随机数分布参数的平均值和理论平均值的显著性差异检验。

设η1，η2，…，ηN是需要进行统计检验的一组随机数，是在[0，1]上服从均匀分布的总体ξ的N个独立的观察值。由此可以得到ξ的一阶原点矩阵、二阶原点方差的估计值分别为

它们的数学期望和方差分别为

由中心极限定理可知，当N充分大时，统计量

近似地服从N（0，1）分布。

当给定显著性水平a后，即可根据正态分布表确定临界值μα，并据此判断各抽样值和理论值之间的差异是否显著，确定能否把η1，η2，…，ηN视为[0，1]上均匀分布的随机变量ξ的N个独立抽样值。通常取显著性水平α=0.05，在这样的显著性水平下，当满足-1.96≤μi≤1.96（i=1，2，3）时称差异不显著，可以接受这一批抽样值。否则称差异显著，不能接受这一批抽样值。

2）均匀性检验

所谓均匀性检验，是用来检验抽样值的经验频率和理论频率是否有显著性差异，其具体做法如下。

时，ηi分在第j组。

然后，计算各组中理论频数mi和实际频数ni。根据均匀性假设，ηi（i=0，1，2，…，N）落在每个小区间里的概率应等于这个小区间的长度，即

pi=1/k（7-32）

则N个ηi落在任一个小区间的频数为

mj=Npi=N/k（7-33）

根据χ2检验公式计算统计量χ2，并进行统计假设检验统计量

根据数理统计理论，统计量χ2近似地服从χ2（k-1）分布，当给定显著性水平α时，可以从已制成的表中查到χ2的下限值χ2α（k-1）。当

时，说明随机抽样值和理论值无显著性差异，这一组随机数可以接受。

例7.1 已有[0，1]区间中1000个随机数抽样值。将其分到10个等距离的区间中（即k=10），每组中的实际频数和理论频数如表7-2所示。若给定显著性水平α=0.05，试问这组随机数能否被接收。

表7-2 实际频数和理论频数