1.4 条件概率
1.4.1 条件概率的定义
条件概率是概率论中的一个重要而实用的概念.它所考虑的是事件B已发生的条件下事件A发生的概率.先举一个例子.
【例1.14】某个班级有学生40人,其中共青团员15人.全班分成4个小组,第一小组有10人,其中共青团员4人.如果要在班级内任选一人当学生代表,那么这个代表恰好在第一小组内的概率为.现在要在班级中任选一个共青团员当学生代表,问这个代表恰好在第一小组内的概率是多少?大多数读者一定会立即算出这个概率是4/15.这两个概率不相同是容易理解的,因为在第二个问题里,任选一个学生必须是团员,这就比第一个问题多了一个“附加”条件.如果我们记
A={在班内任选一个学生,该学生属于第一小组},
B={在班内任选一个学生,该学生是共青团员},
可以看到,在第一个问题里求得的是P(A),而在第二个问题里,是在“已知事件B发生”的附加条件下,求A发生的概率,这个概率称作是在B发生的条件下,A发生的条件概率,并且记作P(A|B).于是有
我们把事件B已发生作为条件,在此条件下事件A发生的概率称为条件概率.
定义1.6 设A、B是两个事件,且P(B)>0,称
为在事件B发生的条件下事件A发生的条件概率(Conditional probability).
不难验证,条件概率P(•|B)符合概率定义中的三个条件,即
(1)非负性:对于每一事件A,有P(A|B)≥0;
(2)规范性:对于必然事件Ω,有P(Ω|B)=1;
(3)可列可加性:设A1,A2,…,An,…是两两互不相容的事件,则有
既然条件概率符合上述三个条件,故1.3节中对概率所证明的一些重要结果都适用于条件概率.例如,对于任意事件A1、A2有
【例1.15】一盒子装有4件产品,其中有3件一等品,1件二等品.从中依次取出两件产品,每次任取一件,作不放回抽样.记事件A={第一次取到的是一等品},事件B={第二次取到的是一等品}.试求条件概率P(A|B).
解 将产品编号:1,2,3号为一等品;4号为二等品.以(i,j)表示第一次、第二次分别取到第i号、第j号产品.试验E(抽取产品两次,记录其号码)的样本空间为
Ω={(1,2),(1,3),(1,4),(2,1),(2,3),(2,4),…,(4,1),(4,2),(4,3)},
B={(1,2),(1,3),(2,1),(2,3),(3,1),(3,2),(4,1),(4,2),(4,3)},
AB={(1,2),(1,3),(2,1),(2,3),(3,1),(3,2)},
按式(1.4.1),得条件概率
此题也可以直接按条件概率的含义用缩小样本空间的方法来求P(A|B).我们知道,当事件B发生以后,试验E所有可能结果的集合就是B,B中有9个元素,其中只有(1,2),(1,3),(2,1),(2,3),(3,1),(3,2)这6个元素属于A,故可得.
【例1.16】老张的妻子一胎生了3个孩子,已知老大是女孩,求另两个孩子也都是女孩的概率(假设男孩、女孩出生率相同).
解 这是一个古典概型问题.
用B表示事件“老大是女孩”,用A表示事件“三个孩子都是女孩”,则B由4个样本点组成,A由一个样本点组成,所求概率是在B发生的条件下A发生的概率.所以
1.4.2 乘法公式
由条件概率的定义(1.4.1),立即可得下述定理.
定理1.1 设A、B是两个事件,且P(B)>0,则
式(1.4.3)称为乘法公式,它也可写成
P(AB)=P(A)P(B|A)(P(A)>0).
式(1.4.3)可以推广到多个事件的积的情况.
例如,设A、B、C为事件,且P(AB)>0,则有
在这里,注意到由假设P(AB)>0可推得P(A)≥P(AB)>0.
【例1.17】设某光学仪器厂制造的透镜,第一次落下时被打破的概率为,若第一次落下未被打破,第二次落下被打破的概率为,若前两次落下未被打破,第三次落下被打破的概率为.试求透镜落下三次而未被打破的概率.
解 以Ai(i=1,2,3)表示事件“透镜第i次落下被打破”,以B表示事件“透镜落下三次而未被打破”.因为,故有
另解,按题意,而A1、是两两互不相容的事件,
故有
故得
【例1.18】设袋中有n1只红球,n2只白球.每次自袋中任取一只球,观察其颜色后放回,并再放入a只与所取出的那只球同色的球.若在袋中连续取四次,试求第一、二次取到红球且第三、四次取到白球的概率.
解 以Ai(i=1,2,3,4)表示事件“第i次取到红球”,则分别表示事件第三、四次取到白球.所求概率为
1.4.3 全概率公式
在前面的学习中,我们知道概率的加法公式和乘法公式可以解决很多概率计算问题,但对于许多较复杂的概率计算我们还无能为力.本节我们学习全概率公式.首先引入样本空间的划分.
1. 样本空间的划分
定义1.7 设Ω为试验E的样本空间,B1,B2,…,Bn为E的一组事件.若
(1)BiBj=Ø,i≠j,i,j=1,2,…,n;
(2)B1+B2+…+Bn=Ω,
则称B1,B2,…,Bn为样本空间Ω的一个划分.
若B1,B2,…,Bn是样本空间的一个划分,那么,对每次试验,事件B1,B2,…,Bn中必须有一个且仅有一个发生.
比如,试验E为“掷一颗骰子观察其点数”.它的样本空间为Ω={1,2,3,4,5,6}.E的一组事件B1={1,2,3},B2={4,5},B3={6}是Ω的一个划分.而事件组C1={1,2,3},C2={3,4},C3={5,6}不是Ω的划分.
2. 全概率公式
定理1.2 设试验E的样本空间为Ω,A为E的事件,B1,B2,…,Bn为Ω的一个划分,且P(Bi)>0(i=1,2,…,n),则
式(1.4.5)称为全概率公式.
证 因为
A=AΩ=A(B1+B2+…+Bn)=AB1+AB2+…+ABn,
由假设P(Bi)>0(i=1,2,…,n),且(ABi)(ABj)=Ø,i≠j,i,j=1,2,…,n,得到
P(A)=P(AB1)+P(AB2)+…+P(ABn)
=P(A|B1)P(B1)+P(A|B2)P(B2)+…+P(A|Bn)P(Bn).
特别地,若取n=2,并将B1记为B,此时B2就是,那么全概率公式为
全概率公式解决由因索果问题.每个原因都可能导致事件A发生,故A发生的概率是各原因引起A发生的概率的总和,“全概率公式”之“全”取为此意.通过这个公式将对一复杂事件A的概率求解问题转化为了在不同情况下发生的简单事件的概率的求和问题.
【例1.19】高射炮向敌机发射三发炮弹,每弹击中与否相互独立且每发炮弹击中的概率均为0.3,又知敌机若中一弹,坠毁的概率为0.2,若中两弹,坠毁的概率为0.6,若中三弹,敌机必坠毁.求敌机坠毁的概率.
解 设事件A=“敌机坠毁”,事件Bi=“敌机中i弹”,i=0,1,2,3.
由题意知,B0、B1、B2、B3是样本空间的一个划分,但是事件A只和B1、B2、B3有关,所以
从而得P(A)=0.441×0.2+0.189×0.6+0.027=0.2286.
【例1.20】据美国的一份资料报导,在美国总的来说患肺癌的概率约为0.1%,在人群中有20%是吸烟者,他们患肺癌的概率约为0.4%,求不吸烟者患肺癌的概率是多少?
解 以C记事件“患肺癌”,以A记事件“吸烟”,按题意P(C)=0.001,P(A)=0.20,P(C|A)=0.004.需要求条件概率).由全概率公式有
将数据代入,得
1.4.4 贝叶斯公式
贝叶斯公式和前面的概率加法公式、乘法公式以及全概率公式构成概率计算问题的四大公式.贝叶斯公式在医学、市场预测、信号估计、概率推理以及产品检查中有非常广泛的应用,它实质上是加法公式和乘法公式的综合运用.全概率公式给出了事件A随着两两互斥的事件B1,B2,…,Bn中某一个出现而出现的概率.如果反过来知道事件A已出现,但不知道它因B1,B2,…,Bn中哪一个事件出现而与之同时出现,这样便产生了在事件A已出现的条件下,求事件Bi(i=1,2,…,n)出现的条件概率的问题,解决这类问题有如下公式.
定理1.3 设试验E的样本空间为Ω,A为E的事件,B1,B2,…,Bn为Ω的一个划分,且P(A)>0,P(Bi)>0(i=1,2,…,n),则
式(1.4.6)称为贝叶斯公式.
证 由条件概率的定义及全概率公式即得
特别地,若取n=2,并将B1记为B,此时B2就是,那么,贝叶斯公式为
在日常生活中,我们会遇到许多由因求果的问题,也会遇到许多由果溯因的问题.比如某种传染疾病已经出现,寻找传染源;机械发生了故障,寻找故障源等就是典型的由果溯因问题.在一定条件下,这类由果溯因问题可通过贝叶斯公式来求解.通常称各“原因”的概率P(Bi)为先验概率,结果A发生的条件下各“原因”的概率P(Bi|A)为后验概率,前者往往是根据以往经验确定的一种主观概率,而后者是在结果A发生之后对原因Bi的重新认识.以下从几个例子来说明贝叶斯公式的应用.
【例1.21】某电子设备制造厂所用的元件是由三家元件制造厂提供的.根据以往的记录有表1.3的数据.
表1.3 三家元件制造厂所占份额及次品率
设这三家工厂的产品在仓库中是均匀混合的,且无区别的标志.
(1)在仓库中随机取一只元件,求它是次品的概率.
(2)在仓库中随机取一只元件,已知取到的是次品,为分析此次品出自何厂,需求出此次品由三家工厂生产的概率分别是多少.试求这些概率.
解 设A表示“取到的是一只次品”,Bi(i=1,2,3)表示“所取到的产品是由第i家工厂提供的”.易知,B1、B2、B3是样本空间Ω的一个划分,且有
P(B1)=0.15,P(B2)=0.80,P(B3)=0.05;
P(A|B1)=0.02,P(A|B2)=0.01,P(A|B3)=0.03.
(1)由全概率公式得
P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+P(A|B3)p(B3)=0.0125.
(2)由贝叶斯公式得
P(B2|A)=0.64,P(B3|A)=0.12.
以上结果表明,这只次品来自第2家工厂的可能性最大.
【例1.22】对以往分析结果表明,当机器调整良好时,产品的合格率为98%,而当机器发生某种故障时,其合格率为55%.每天早上机器开动时,机器调整良好的概率为95%.试求已知某日早上第一件产品是合格品时,机器调整良好的概率是多少?
解 设A={产品合格},B={机器调整良好}.
已知P(A|B)=0.98,,P(B)=0.95,,所需求的概率为P(B|A).由贝叶斯公式得
这就是说,当生产出第一件产品是合格品时,此时机器调整良好的概率为0.97.这里,概率0.95是由以往的数据分析得到的,叫作先验概率.而在得到信息(即生产第一件产品是合格品)之后再重新加以修正的概率(即0.97)叫作后验概率.有了后验概率我们就能对机器的情况有进一步的了解.
【例1.23】根据以往的临床记录,某种诊断癌症的试验具有如下的效果:若以A表示事件“试验反应为阳性”,以C表示事件“被诊断者患有癌症”,则有P(A|C)=0.95,.现在对自然人群进行普查,设被诊断的人患有癌症的概率为0.005,即P(C)=0.005,试求P(C|A).
解 已知
P(A|C)=0.95,,
P(C)=0.005,.
由贝叶斯公式得
本题的结果表明,虽然P(A|C)=0.95,,这两个概率都比较高,但若将此试验用于普查,则有P(C|A)=0.087,亦即其正确性只有8.7%(平均1000个具有阳性反应的人中大约只有87人确实患有癌症).如果没注意到这一点,将会得出错误的诊断,这也说明,若将P(A|C)和P(C|A)混淆了会造成不良的后果.