大话机器智能:一书看透AI的底层运行逻辑
上QQ阅读APP看书,第一时间看更新

1.6.2 停时理论

假设检验关心的是如何在不确定的情况下验证一个假设。有时,我们还会遇到另一类问题——在不确定的情况下,何时对一件事情做出决策。生活中我们无时无刻不在做决策,可难点在于,很多决策并不像考试那样有标准答案。有时决策的时机稍纵即逝,一旦错过就再也无法挽回。

试问,相亲时应该去多少次,才能认定眼前的他或她是自己的理想伴侣?如果我们既不想与眼前这位失之交臂,又不能确定下一位出现的人才是一生的伴侣,这时该怎么办?看房时,我们应该当机立断选定眼前的这套房子并把定金付了,还是掉头就走?毕竟热门房型很快就会被一抢而空,我们不能犹豫。

再来看个例子。1960年,《科学美国人》杂志的“趣味数学”中刊登了几个难题,其中有一个问题就是秘书问题:假设很多人申请秘书岗位,你是面试官,你的目标是从这些人中选出最佳人选。你不知道如何为每个申请人评分,但是可以通过比较判断出更优秀的申请人。面试时,你随时可以决定将这份工作交给对方,然后面试工作就此结束。一旦你否决了一名面试者,就不能改变主意,不能再回头选择他。可难点在于,既然无法重来,那就必须在某一时刻做出决定,否则很可能面试完所有人,发现自己已经错过了最佳人选。但在面试过程中,只要不到最后一人,我们的选择就永远伴随不确定性,因为我们不能确认眼前的人就是最优秀的。

上述这些问题讨论的是观望和出手的时机。解答此类问题有一个停时理论,也叫最优停止理论。它的数学解法是这样的:假定共有n个选择时刻(或n个数),现在在第k个时刻(或者第k个数)做出选择,在做出选择后,我们可以计算出后面有比这个选择更好的时刻(或数)的概率P(k),即求出最优选择出现在第k个时刻(或者第k个数)之后的概率。有了概率P(k),通过一些数学上的规划求解方法,我们能得到这个概率函数的最大理论值。具体的数学推导这里不再详述,读者只要知道,当数据总量很大时(比如面试的总人数很多),这个结果近似等于总量的1/e,也就是37%左右。(e是自然对数函数的底数,它是数学常数,约等于2.7。)

于是,我们可以得出这样的结论:假如需要面试100个人,那么前37个人可以随便看看,后面只要碰到一个比前面这些都好的就赶紧定下来,这似乎对前面37个人不太友好。如果你知道了其背后的原理,那么我建议你在参加面试时,尽量选择在37%以后出现,或许通过概率会高一点。对于相亲和看房,也是同样的道理。

可见,数学家总是能将一个具体的生活问题抽象成一个合理的数学问题,无论是相亲、看房还是面试,哪怕我们的选择具有不确定性,我们也可以找到一个相对确定的最优选择方案。