第一节 随机变量及其分布
一、随机变量的定义
在随机试验中有很多试验结果本身就是用数量表示,例如,
(1)抛掷一枚均匀的骰子,出现的点数X的取值;
(2)每年每辆参保的车辆会发生理赔的次数N,每次理赔的金额Y,这里N和Y的取值;
(3)测量的随机误差ε的取值.
在随机试验中还有很多试验结果本身不是用数量表示,这时可以根据需要设置变量,例如,
(1)抛掷一枚均匀的硬币,观察其朝上的面,则样本空间Ω={正面朝上,反面朝上}.这时,可按如下方式设置一个变量X:
在这里,X的取值对应如下随机事件:
{X=1}={正面朝上},{X=0}={反面朝上} .
(2)抛掷三枚均匀的硬币,观察其朝上的面,则样本空间Ω={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT},其中H表示正面朝上,T表示反面朝上.这时,若一个变量X表示“三次抛掷中反面朝上的次数”,则X的取值与样本点之间有如下的对应关系:
在这里,X的取值对应如下随机事件:
{X=0}={反面朝上0次}={HHH},{X=1}={反面朝上1次}={HHT,HTH,THH},{X=2}={反面朝上2次}={HTT,THT,TTH},{X=3}={反面朝上3次}={TTT}.
下面,我们给出随机变量的一般定义.
定义1 在随机试验E中,Ω是相应的样本空间,如果对Ω中的每一个样本点ω,有唯一一个实数X(ω)与它对应,那么就把这个定义域为Ω的单值实值函数X=X(ω)称为(一维)随机变量.
随机变量一般用大写字母X,Y等来表示,随机变量的取值一般用小写字母x,y等来表示.如果一个随机变量仅可能取有限或可列个值,则称其为离散型随机变量.如果一个随机变量的取值充满了数轴上的一个区间(或某几个区间的并),则称其为非离散型随机变量.连续型随机变量就是非离散型随机变量中最常见的一类随机变量.
随机变量的定义可直观解释为:随机变量X是样本点的函数,这个函数的自变量是样本点,可以是数,也可以不是数,定义域是样本空间,而因变量必须是实数.这个函数可以让不同的样本点对应不同的实数,也可以让多个样本点对应于一个实数.
随机变量的引入是概率论发展走向成熟的一个标志,它弥补了随机试验下的随机事件种类繁多、不易一一总结它们发生的可能性大小的规律的缺陷,因为如果知道随机变量的分布,随机试验下任一随机事件的概率也随之可以得到;另外引入随机变量后,可以使用数学中的微积分工具讨论随机变量的分布.
二、随机变量的分布函数
随机变量X是样本点ω的一个实值函数,为了掌握X的统计规律性,我们需要知道X取值于某个区间的概率.由于
{a<X≤b}={X≤b}-{X≤a},
{X>c}=Ω-{X≤c}.
因此,对于任意实数x,只需知道{X≤x}的概率就足够了,我们用F(x)表示这个概率值,显然这个概率值与x有关,不同的x,此概率值也不一样,下面给出分布函数的定义.
定义2 设X是一个随机变量,对于任意实数x,称函数
F(x)=P(X≤x),-∞<x<+∞
为随机变量X的分布函数.
对任意的两个实数-∞<a<b<+∞,有
P(a<X≤b)=F(b)-F(a).
因此,只要已知X的分布函数,就可以知道X落在任一区间(a,b]内的概率,所以说,分布函数可以完整地描述一个随机变量的统计规律性.
从这个定义可以看出:
(1)分布函数是定义在(-∞,+∞)上,取值在[0,1]上的一个函数;
(2)任一随机变量X都有且仅有一个分布函数,有了分布函数,就可计算与随机变量X相关事件的概率问题.
例1 设一盒子中装有10个球,其中5个球上标有数字1,3个球上标有数字2,2个球上标有数字3.从中任取一球,记随机变量X表示为“取得的球上标有的数字”,求X的分布函数F(x).
解 根据题意可知,随机变量X可取1,2,3,由古典概型的计算公式,可知对应的概率值分别为0.5,0.3,0.2.
分布函数的定义为F(x)=P(X≤x),因此
当x<1时,概率P(X≤x)=0;
当1≤x<2时,概率P(X≤x)=P(X=1)=0.5;
当2≤x<3时,概率P(X≤x)=P(X=1)+P(X=2)=0.5+0.3=0.8;
当x≥3时,随机事件{X≤x}为必然事件,因此P(X≤x)=1,即
P(X≤x)=P(X=1)+P(X=2)+P(X=3)=0.5+0.3+0.2=1.
整理可得X的分布函数为
F(x)的图形如图2.1所示,它是一条阶梯形的曲线,在X的三个可能取值1,2,3处有右连续的跳跃点,其每次跳跃的高度正好是X在该取值点的概率.
图2.1 F(x)的图形
从例1中的分布函数及其图形中可以看到分布函数具有右连续、单调不减等性质,具体来说,任一分布函数F(x)有如下性质:
(1)对于任意实数x,有0≤F(x)≤1,
(2)F(x)单调不减,即当x1<x2时,有F(x1)≤F(x2);
(3)F(x)是x的右连续函数,即
证明略.
三、离散型随机变量及其分布律
设E是随机试验,Ω是相应的样本空间,X是Ω上的随机变量,若X的值域(记为ΩX)为有限集或可列集,此时称X为(一维)离散型随机变量.
定义3 若一维离散型随机变量X的取值为x1,x2,…,xn,…,称相应的概率
P(X=xi)=pi,i=1,2,…
为离散型随机变量X的分布律(或分布列、概率函数).
一维离散型随机变量的分布律也可用下表来表示.
且满足(1)非负性pi≥0,i=1,2,…;(2)规范性这两条性质也是判别某一数列是否能成为分布律的充要条件.
例2 设随机变量X的分布律如下.
求(1)P(X≤-0.7);(2)X的分布函数F(x).
解 (1)P(X≤-0.7)=P(X=-1)=0.2.
(2)X的分布函数F(x)求解过程同例1,可得
从这个例子中可知,已知一个离散型随机变量的分布律,就可以求得其分布函数;反之,若已知一个离散型随机变量的分布函数,也可以通过如下过程求得其分布律:
P(X=-1)=P(X≤-1)=F(-1)=0.2,
P(X=0)=P(-1<X≤0)=F(0)-F(-1)=0.6-0.2=0.4,
P(X=2)=P(0<X≤2)=F(2)-F(0)=1-0.6=0.4.
因此可得X的分布律如下.
从上面的分析中可以发现,分布函数和分布律对离散型随机变量的取值规律描述是等价的,比较而言,分布律更直观、方便.
四、连续型随机变量及其密度函数
连续型随机变量的取值充满了数轴上的一个区间(或某几个区间的并),在这个区间里有无穷不可列个实数,因此当我们描述连续型随机变量时,用来描述离散型随机变量的分布律就没法再使用了,而要改用概率密度函数来表示.
密度函数
定义4 设E是随机试验,Ω是相应的样本空间,X是Ω上的随机变量,F(x)是X的分布函数,若存在非负函数f(x)使得
则称X为(一维)连续型随机变量,f(x)称为X的(概率)密度函数,满足:(1)非负性f(x)≥0,-∞<x<+∞;(2)规范性
概率密度函数f(x)与分布函数F(x)之间的关系如图2.2所示,F(x)=P(X≤x)恰好是f(x)在区间(-∞,x]上的积分,也即是图中阴影部分的面积.
图2.2 f(x)与F(x)的几何关系
连续型随机变量具有下列性质:
(1)分布函数F(x)是连续函数,在f(x)的连续点处,F′(x)=f(x);
(2)对任意一个常数c,-∞<c<+∞,P(X=c)=0,所以,在事件{a≤X≤b} 中剔除X=a或剔除X=b,都不影响概率的大小,即
P(a≤X≤b)=P(a<X≤b)=P(a≤X<b)=P(a<X<b).
需注意的是,这个性质对离散型随机变量是不成立的,恰恰相反,离散型随机变量计算的就是“点点概率”.
此外,这一性质还能帮助我们判断一个非离散型随机变量是否是连续型随机变量.如果一个非离散型随机变量不存在离散的点,它的概率不为0,则该随机变量为连续型随机变量.
(3)对任意的两个常数a,b,
例3 设连续型随机变量X的密度函数为
求(1)P(|X|<0.5);(2)X的分布函数F(x).
解 (1)
(2)
显然,不难求出F(x)的导数即为x的密度函数.F(x)的图形如图2.3所示,它是一条连续的曲线,同时它也满足F(x)的所有性质.
图2.3 F(x)的图形
习题2-1
1. 试确定常数c,使得下列函数成为某个随机变量X的分布律:
(1)P(X=k)=ck,k=1,…,n;
(2)
2. 试确定常数c,使成为某个随机变量X的分布律,并求:
(1)P(X≥2);
(2)
(3)X的分布函数F(x).
3. 一口袋中有5个球,在这5个球上分别标有数字1,2,3,4和5.从这袋中不放回任取3个球,设各个球被取到的可能性相同,求取得的球上标明的最大数字X的分布律与分布函数.
4. 已知随机变量X的分布律如下.试求一元二次方程3t2+2Xt+(X+1)=0有实数根的概率.
5. 设随机变量X的分布函数为
求X的密度函数,并计算P(X≤1)和P(X>2).
6. 已知连续型随机变量X的分布函数为
(1)a,b取何值时F(x)为连续函数?
(2)求
(3)求X的密度函数.
7. 设随机变量X的密度函数为
求(1)常数c的值;(2)(3)X的分布函数F(x).
8. 设随机变量X的密度函数为
求(1)常数a的值;(2)P(-1<X≤2).
9. 已知随机变量X的密度函数为
求(1)P(0<X<1);(2)X的分布函数.
10. 设某种晶体管的寿命(单位:小时)是一个随机变量X,它的密度函数为
(1)试求该种晶体管不能工作150小时的概率;
(2)一台仪器中装有4只此种晶体管,试求该仪器工作150小时后至少有一只失效的概率(假定这四只晶体管是否失效是互不影响的).