§4 随机变量函数的分布
学习了随机变量及其分布,可以帮助人们解决许多实际问题。但是,在工作实践中,还常常遇到用随机变量函数的分布才能解决的问题。例如:圆的直径X是随机变量,需要研究圆面积S=πX2/4的概率分布问题;又如:商品的价格X、成本Y都是随机变量,需要研究盈利Z=X-Y的概率分布,等等。下边介绍随机变量的函数及其概率分布。
一、一维随机变量的函数及其分布
设X是一维随机变量,y=g(x)是连续实函数,则Y=g(X)也是一维随机变量。称g(X)为随机变量X的函数。下面,讨论如何从X的分布导出Y=g(X)的分布。
1.离散型的情形
设X的分布律为
P{X=xi}=pi (i=1,2,…,n,…)
y=g(x)为连续实函数,则Y=g(X)的分布律可按下述方法求得:
P{g(X)=g(xi)}=pi (i=1,2,…,n,…) (4.1)
若函数值g(x1),g(x2),…,g(xn),…均不相同,则(4.1)即为Y=g(X)的分布律。
若函数值g(x1),g(x2),…,g(xn),…有些相同,相同的只写一个,对应概率相加,其余的照抄,即可得到Y=g(X)的分布律。
下边举例说明。
【例1】 设X的分布律为P{X=i}=1/3,(i=1,2,3),求(1)Y=X2-1的分布律;(2)的分布律。
解 (1)Y=X2-1的分布律为
P{Y=i2-1}=1/3(i=1,2,3)
或用表格形式表示
(2),
因i=1和i=3时
i=2时
故的分布律为
或用表格形式表示
2.连续型情形
设X为一维连续型随机变量,其概率密度为f(x),y=g(x)为连续实函数,可求得随机变量函数Y=g(X)的概率分布,下边举例说明。
【例2】 设随机变量X有分布函数FX(x),随机变量Y=aX+b(a≠0)。这是两个随机变量之间的一种最简单也是最常用的函数关系,称为线性函数关系。令FY(y)表示随机变量Y的分布函数,则
FY(y)=P{Y≤y}=P{aX+b≤y}=P{aX≤y-b}
当a>0时
当a<0时
其中表示X的分布函数FX(x)在点处左极限。当X为连续型随机变量时,由FX(x)的连续性可知,。此时有
由此可得,对连续型随机变量,若X有密度函数fX(x),令fY(y)表示Y的密度函数,根据密度函数与分布函数之间的关系,有
【例3】 设X~N(0,1),求Y=X2的密度函数。
解 FY(y)=P{Y≤y}=P{X2≤y}
当y<0时 FY(y)=0
当y≥0时
故
例3的方法具有代表性。求随机变量函数Y=g(X)的分布,往往先求Y的分布函数FY(y),其关键一步是解不等式“g(X)≤y”得到与之等价的X的变化范围,并以后者代替“g(X)≤y”。如例3中当y≥0时以“”代替“X2≤y”。一般来说,都可以用这样的方法求连续型随机变量函数的分布函数和密度函数。
当y=g(x)为单调函数,且g'(x)≠0,x=φ(y)为y=g(x)的反函数时,则Y=g(X)的密度函数为
(4.2)
其中 α=min{g(-∞),g(+∞)}
β=max{g(-∞),g(+∞)}
下边举例说明。
【例4】 设X~N(μ,σ2),求Y=aX+b(a≠0)的密度函数。
解 y=ax+b是单调函数,y'=a≠0,。由式(4.2)可得
即 Y=aX+b~N(aμ+b,a2σ2)
上述结果说明:若X~N(μ,σ2),则X的线性函数Y=aX+b(a≠0)仍服从正态分布,且Y~N(aμ+b,a2σ2)。
当,时,。上述结果化为:若X~N(μ,σ2),则。这又一次说明了,为什么可以用变换把一般正态分布化为标准正态分布的道理。
二、二维随机变量的函数及其分布
设(X,Y)是二维随机变量,z=g(x,y)是二元连续实函数,则Z=g(X,Y)也是随机变量。下边介绍由(X,Y)的分布导出Z=g(X,Y)的分布的方法。
1.离散型的情形
设(X,Y)的联合分布律P{X=xi,Y=yj}=pij(i=1,2,…;j=1,2,…),则Z=g(X,Y)的分布律可用下述方法求得:
P{Z=g(xi,yj)}=pij(i=1,2,…;j=1,2,…) (4.3)
当函数值g(xi,yj)(i=1,2,…;j=1,2,…)均不相同时,式(4.3)即为Z=g(X,Y)的分布律。
当函数值g(xi,yj)(i=1,2,…;j=1,2,…)中有相同值时,相同值只写一个,对应概率相加,其余不变,即可得到Z=g(X,Y)的分布律。
下边举例说明。
【例5】 设X,Y相互独立且服从同一分布,其分布律为P{X=i}=1/3(i=1,2,3)。求(1)Z=X+Y的分布律;(2)Z=max{X,Y}的分布律;(3)Z=min{X,Y}的分布律。
解 由已知条件(X,Y)的联合分布律为
(1)Z=X+Y的分布律
类似可求得
P{Z=5}=2/9, P{Z=6}=1/9
或用表格形式表示:
(2)Z=max{X,Y}的分配律
类似可求出 P{Z=3}=5/9
或用表格形式表示
(3)用类似于(2)的方法可求得Z=min{X,Y}的分布律
【例6】 若X1,X2,…,Xn独立且服从同一分布,其分布律为
P{X=k}=pk(1-p)1-k (k=0,1;0<p<1)
试证:服从二项分布B(n,p)。
注 本例的结论说明,n个相互独立的参数为p的(0—1)分布之和,是参数为n与p的二项分布B(n,p)。
证 用数学归纳法证明。
当n=2时,则Z=X1+X2的分布律为
即 X1+X2~B(2,p)
假设n=m时结论正确,即成立。
当n=m+1时
故
对于二项分布,如果X1,X2,…,Xn独立,且Xi~B(ki,p)(i=1,2,…,n),则可用数学归纳法证明。
对于泊松分布,也有类似结果:
若X1,X2,…,Xn独立,且Xi~P(λi)(i=1,2,…,n),则也可用数学归纳法证明。
2.连续型的情形
设(X,Y)为二维连续型随机变量,f(x,y)为(X,Y)的联合密度,z=g(x,y)为二元连续实函数,则Z=g(X,Y)的密度函数常常用下述方法求得:
先求Z的分布函数FZ(z)=P{g(X,Y)≤z},则Z的密度函数fZ(z)=。[在fZ(z)的连续点处]
(1)Z=X+Y的分布
令y=v-x,则
所以
(4.4)
当X,Y独立时
(4.5)
用类似的方法可得:
(4.6)
式(4.5)、式(4.6)称为卷积公式。
注 关于二维离散型随机变量也有类似的结果。
设(X,Y)为二维离散型随机变量,X与Y独立。
P{X=xi,Y=yj}=P{X=xi}·P{Y=yj}(i,j=1,2,3,…)
令Z=X+Y,Z的取值也是离散型的
Z=zk=xi+yj (i,j,k=1,2,…)
(4.7)
同理也有
(4.8)
另外,X-Y的分布可转化成X+(-Y),详细讨论从略。
【例7】 设X与Y相互独立,且均服从标准正态分布,求Z=X+Y的密度函数。
解 因X,Y独立,且
由式(4.6)可得
令 ,则
即 X+Y~N(0,2)。
此例说明,两个相互独立的均服从标准正态分布的随机变量之和的分布仍为正态分布。这个结论还可以推广到更一般的情形:若X1,X2,…,Xn相互独立且分别服从(i=1,2,…,n),则。可用数学归纳法证明。
【例8】 设X,Y相互独立,均服从区间[1,3]上的均匀分布,求Z=X+Y的密度函数。
解 由式(2.2)可知
又因X,Y独立,由式(4.6)可知
要使fX(x)fY(z-x)≠0,当且仅当
(图2-9)
图2-9
当z-1<1或z-3≥3,即z<2或z≥6时
fX(x)fY(z-x)=0
fZ(z)=0
当1≤z-1<3,即2≤z<4时
当1≤z-3<3,即4≤z<6时
总之
(2)距离分布(的分布)
【例9】 设X,Y相互独立,均服从正态分布N(0,σ2),求的密度函数。
解
当z<0时,,故
FZ(z)=0
当z≥0时
而 fZ(z)=F'(z),所以
(3)max(X,Y)与min(X,Y)的分布
设 M=max(X,Y),N=min(X,Y)
则 (4.9)
(4.10)
当X,Y相互独立时
FM(z)=FX(z)FY(z) (4.11)
(4.12)
此结论可推广到一般的情形:
若X1,X2,…,Xn相互独立,其分布函数分别为F1(x),F2(x),…,Fn(x),则
Z=max(X1,X2,…,Xn)的分布函数为
FZ(z)=F1(z)·F2(z)…Fn(z) (4.13)
Z=min(X1,X2,…,Xn)的分布函数为
FZ(z)=1-[1-F1(z)]·[1-F2(z)]…[1-Fn(z)] (4.14)
【例10】 设系统L由相互独立的两个子系统L1,L2连接而成,联接的方式分别为(1)串联;(2)并联;(3)备用(当系统L1损坏时,系统L2开始工作),如图2-10所示,设L1,L2的寿命分别为X,Y,已知它们的密度函数分别为试分别就以上三种联接方式求出系统L的寿命Z的密度。
图2-10
解 (1)串联 L1与L2有一个损坏,则整个系统L就不能正常工作。故L的寿命
Z=min(X,Y)
又因X,Y独立,由式(4.11)知
FZ(z)=FX(z)+FY(z)-FX(z)FY(z)
由已知条件可得
故
(2)并联 L1,L2只要有一个不损坏,整个系统L就能正常工作。故L的寿命
Z=max{X,Y}
又因X,Y独立,由式(4.10)知
FZ(z)=FX(z)·FY(z)
所以
(3)备用L的寿命 Z=X+Y
由式(4.6)知:
当z≤0时,fX(x)fY(z-x)=0,故 fZ(z)=0
当z>0时
总之
(4)二维联合密度函数的变量代换公式
从前面例子可以看出,在求随机向量(X,Y)的函数Z=g(X,Y)的分布时,关键是设法将其转化为(X,Y)在一定范围内取值的形式,从而利用已知的分布求出Z=g(X,Y)的分布。
若每一个问题都这样求,是很麻烦的。下面我们介绍一个用来求随机向量(X,Y)的函数的分布的定理。对二维情形,表述如下。
定理4.1 设(X1,X2)是具有密度函数f(x1,x2)的连续型二维随机变量。
①设Y1=g1(X1,X2),Y2=g2(X1,X2)是R2到自身的一对一的映射,即存在定义在该变换的值域上的逆变换X1=h1(Y1,Y2),X2=h2(Y1,Y2);
②假定变换和它的逆都是连续的;
③假定偏导数∂hi/∂yj,i=1,2,j=1,2存在且连续;
④假定逆变换的雅可比行列式
则Y1,Y2具有联合密度
w(y1,y2)=f(h1(y1,y2),h2(y1,y2))|J| (4.15)
【例11】 设(X1,X2)具有密度函数f(x1,x2),令Y1=X1+X2,Y2=X1-X2。试用f表示Y1和Y2的联合密度函数。
解 令y1=x1+x2,y2=x1-x2,则逆变换为
故由式(4.15),所求密度函数为
有时,我们所求的只是一个函数Y1=g1(X1,X2)的分布。一个办法是:引入另一个函数Y2=g2(X1,X2),使(X1,X2)到(Y1,Y2)成一一对应变换。根据定理4.1,由式(4.14)得到(Y1,Y2)的联合密度函数w(y1,y2)=f(h1(y1,y2),h2(y1,y2))|J|,最后,Y1的密度函数由对w(y1,y2)求边缘密度得到
下面我们通过求来说明。
令Y=Y,它们构成(x,y)到(y,z)的一对一的变换,逆变换为:x=yz,y=y,雅可比行列式为
按式(4.15)得Y和Z的联合密度为w(y,z)=f(yz,y)|y|,根据边缘密度的公式可得
特别,当X与Y独立时,因为f(x,y)=fX(x)·fY(y),所以有
(4.16)
【例12】 设随机变量X,Y相互独立,分别有概率密度函数
试求的概率密度函数。
解 将fX(x)与fY(y)的表达式代入式(4.15),有
当z>0时
当z≤0时 fZ(z)=0
所以