首页 百科知识 随机变量服从正态分布怎么求概率

随机变量服从正态分布怎么求概率

时间:2022-10-22 百科知识 版权反馈
【摘要】:),则将X的可能取值及其相应概率称为离散型随机变量X的概率分布。随机变量的概率分布能够完整反映随机变量的统计规律,但是,在实际问题中概率分布较难确定,而反映随机变量分布某些方面特征的数值,即随机变量的数字特征相对较容易估算出来,并且许多问题的解决往往只需知道某些数字特征。设连续型随机变量X的分布密度为f,则称为连续型随机变量X的方差,记作V。
随机变量及其概率分布_统计学教程

第二节 随机变量及其概率分布

上一节中,我们讨论了随机事件及其概率,为进一步研究随机现象,这一节我们引进随机变量的概念。

一、随机变量

例4-1:已知一批产品共100件,其中10件为次品。对这批产品进行产品质量的抽样检验,现从中随机抽取10件,问:抽到的次品数是多少?

分析:设X表示抽到的次品数,显然X的可能取值为0,1,2,…,10中的任一个,是不确定的,因此,X是变量;由于随机抽取,所以检验前无法确定X的取值,但对任一具体的检验结果,X的取值又是完全确定的,即每一检验结果都惟一对应一个X的实数值。

由此引出随机变量的定义:随机试验E的每一个可能结果ω都惟一对应一个实数值X(ω),则称实值变量X(ω)为随机变量,简记为X。随机变量的可能取值结果记为x。

有许多随机试验的结果不是用数值表示的,如上例对产品质量进行抽样检验,若随机抽取一件产品,检验其质量,结果可能为“合格品”或“不合格品”,即基本事件为“合格品”和“不合格品”,但是我们可以规定X的取值为:

1——“合格品”

0——“不合格品”

这样就把该随机试验的结果完全数量化了。同时X的取值也是不能事先确定的,因此上述定义对所有随机试验都适用。

按照随机变量可能取值性质的不同,随机变量分为:

1.离散型(Discrete)随机变量。如果随机变量X的全部可能取值能够一一列举,则称X为离散型随机变量。如上例。

2.连续型(Continuous)随机变量。如果随机变量X的全部可能取值不能一一列举,则称X为连续型随机变量。如检验一批日光灯的质量,其燃烧寿命可能是某一区间的所有取值。

二、随机变量的概率分布

随机变量可能的取值范围和取这些值相应的概率称为随机变量的概率分布(Probability distribution)。

(一)离散型随机变量的概率分布

设有一离散型随机变量X,可能取值x1,x2,…,xn…(通常写作X={x1,x2,…,xn…}),取各个值的可能性为p1,p2,…,pn…,即P(X=xi)=pi(i=1,2,…,n,…),则将X的可能取值及其相应概率称为离散型随机变量X的概率分布。

离散型随机变量的概率分布可列表如下:

容易知道:(1)pi≥0(i=1,2,…,n…)

     (2)因为x1,x2,…,xn…构成一完备事件组,

所以

例4-2:一批零件中有9个正品,3个次品,安装机器时从这批零件中任取1个。如果每次取出的次品不再放回去,求在取得正品以前已取出次品的概率。

解:设随机变量X表示在取得正品之前已取出的次品数,则X={0,1,2,3},计算得

X的概率分布表如下:

(二)连续型随机变量的概率分布

连续型随机变量的取值可以是一个区间上的任意实数值,因此,连续型随机变量的概率应为事件(a<X<b)的概率。

显然

连续型随机变量的概率也可以用分布函数F(x)来表示,分布函数的定义为:

它也是建立在密度函数f(x)的基础之上的,因此,P(a<X<b)也可以写成:

三、几种重要的随机变量分布

(一)离散型

1.0—1分布。设离散型随机变量X只可能取0和1两个值,概率分布是:

其中,p、q>0为常量,p+q=1,则称X服从0—1分布。

例4-3:100件产品中,有97件正品,3件次品,现从中随机抽取一件,假如抽得每件的机会均相同,则抽得正品的概率为0.97,抽得次品的概率为0.03。

定义随机变量X如下:

则有

P(X=1)=0.97

P(X=0)=0.03

任何一个只有两种可能结果的随机现象,都可以用一个服从0—1分布的离散型随机变量来描述,如产品的合格与不合格、新生儿性别的男与女,等等。

2.二项分布。设单次试验中,某事件A发生的概率为p(0<p<1),现将此试验重复进行n次,则A发生x次的概率为

这种概率模型称为独立试验序列概型。独立试验序列概型的特点是:

(2)重复n次:这里的重复指n次试验中各次试验的条件组是相同的,因此,在每次试验中A发生的概率都是p,并且各次试验的结果是相互独立的。

通常称具有上述特征的n次独立试验为n重贝努里试验(Bernoulli trials),满足独立试验序列概型的概率分布称为二项分布(Binomial distribution),即

如果随机变量X的概率分布是:

其中:0<p<1,q=1-p,则称随机变量X服从二项分布。记作:

X~B(n,p)

例4-4:从一批零件中随机抽取5件进行检验,每次取一件且检验后放回。假设在零件的加工过程中,出现次品的概率为0.05,求5件零件中恰好有x件次品的概率。(x=0,1,2,3,4,5)

解:可以把抽取5个零件看成是5次独立试验。设抽到次品数为X,则X服从参数n=5,p=0.05的二项分布。其概率分布为

计算得

容易看出,n=1时的二项分布是0—1分布。

(二)连续型

在常见的连续型随机变量的概率分布中,最重要的是正态分布(Normal distribution)。

1.正态分布的定义。如果随机变量X的概率密度为:

μ,σ均为常数,且σ>0

-∞<x<+∞则称X服从正态分布,记作

X~N(μ,σ2

正态分布密度曲线的图形如图4-1所示。

图4-1 正态分布密度曲线图

2.正态分布密度函数f(x)的曲线特征。

(1)呈钟形,相对于x=μ对称;

(2)在x=μ处取极大值;

(3)在x=μ±σ处有拐点;

(4)当x→±∞时,曲线以x轴为其渐进线;

(5)若μ不变,则当σ变大,曲线渐平缓,反之则陡峭;若σ不变,曲线的对称轴随μ不同而不同。

由此可见,只要给出μ及σ两个参数,就能确定正态分布的位置和形态。

正态分布的随机变量X介于两个确定值x1、x2之间的概率可以表示为:

表现在正态分布图上,相当于曲线之下横轴之上介于x=x1,x=x2之间的面积。

3.标准正态分布(Standardized normal distribution)。如果正态分布的密度函数f(x)的参数μ=0,σ=1,即X~N(0,1),则为标准正态分布。

一般的正态分布可以通过化简转换成标准正态分布,过程如下:

首先在

中,设

然后将z代入f(x)中,并对f(x)在区间(x1,x2)上积分,得

式中

称为标准正态分布的密度函数。

标准正态分布的分布函数用Φ(x)来表示,即:

最后,Z落在(-z0,+z0)上的概率为

例4-5:设X~N(μ,σ2),求P(μ-σ<X<μ+σ)

解:∵X~N(μ2,σ2),设

Z~N(0,1)

查附录二表1得

2Φ(1)-1=0.6827

同理可得:

P(μ-2σ<X<μ+2σ)=0.9545

P(μ-3σ<X<μ+3σ)=0.9973

四、随机变量函数的分布

常用随机变量函数的分布有χ2分布、t分布和F分布。

(一)χ2分布

设随机变量X1,X2,…,Xn相互独立,且同服从标准正态分布N(0,1),则称随机变量

服从自由度为n的χ2分布,记作χ2~χ2(n)。所谓自由度是指可以自由取值随机变量的个数。

(二)t分布

设X、Y为两个独立随机变量,X~N(0,1),Y~χ2(n),则

称随机变量t服从自由度为n的t分布。

t分布是类似于标准正态分布的对称分布,t分布的概率密度曲线比标准正态分布更平坦。每一种自由度对应一个具体的t分布,当n≥30时,t分布近似于标准正态分布。

(三)F分布

设X、Y为两个独立随机变量,X~χ2(k1),Y~χ2(k2),则

称随机变量F服从第一自由度为k1、第二自由度为k2的F分布。

五、随机变量的数字特征

随机变量的概率分布能够完整反映随机变量的统计规律,但是,在实际问题中概率分布较难确定,而反映随机变量分布某些方面特征的数值,即随机变量的数字特征相对较容易估算出来,并且许多问题的解决往往只需知道某些数字特征。在这些数字特征中,最重要的是期望和方差

(一)期望

1.期望的定义。设离散型随机变量X的概率分布为

则称x1p1+x2p2+…+xkpk+…为随机变量X的数学期望,简称期望(Expectation)或均值,记作E(X)。即

E(X)=∑xipi (i=1,2,…,k,…)

显然,E(X)是一个实数,当X的概率分布已知时,E(X)可由上式计算得出。实质上,E(X)是随机变量X可能取值的加权平均值。

以例4-2中的资料为例:

E(X)=∑xipi=0×0.75+1×0.204+2×0.041+3×0.005=0.301

对于连续型随机变量的概率分布,根据上述期望的定义,可以推广为

2.期望的性质。

(1)常量的数学期望等于常量本身,即E(c)=c(c为常量)。

(2)随机变量X的c倍的数学期望等于随机变量X的数学期望的c倍,即E(cX)=cE(X)。

(3)两个随机变量之和的数学期望,等于它们数学期望之和,即E(X+Y)=E(X)+E(Y)。

(二)方差

随机变量的期望体现了随机变量取值的平均水平,是随机变量概率分布的重要数字特征,但是,仅了解随机变量取值的一般水平还不够,还需知道这些取值的分散程度,方差(Variance)是描述分散程度的重要指标,方差的正平方根称为标准差(Standard variance)。

1.离散型随机变量的方差。设离散型随机变量的概率分布是:

P=(X=xi)=pi(i=1,2,…)

则称

∑[xi-E(X)]2pi(i=1,2,…)

为离散型随机变量X的方差,记作V(X)。

仍以例4-2中的资料为例:

V(X)=∑[xi-E(X)]2pi(i=1,2,…)

   =(0-0.301)2×0.75+(1-0.301)2×0.204+(2-0.301)2×0.041+(3-0.301)2×0.005

   =0.322

2.连续型随机变量的方差。设连续型随机变量X的分布密度为f(x),则称为连续型随机变量X的方差,记作V(X)。

3.方差的性质。

(1)V(X)≥0。

(2)V(X)=E(X2)-[E(X)]2

(三)常见分布的数字特征

根据期望和方差的定义,计算常见随机变量的数字特征见表4-1。

表4-1   常见随机变量概率分布的数字特征

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈