大话机器智能:一书看透AI的底层运行逻辑
上QQ阅读APP看书,第一时间看更新

1.3 概率的威力

数学上的概率论数理统计时常被一并提及,但这两门学科是有区别的。概率论是统计学的基础,它是对随机性进行数学研究的理论基础。数理统计则关注通过大量原始数据研究对象行为规律的方法。可以说,概率论更偏数学理论,数理统计更多的是应用。

统计学不是一定要用到概率论,比如用样本均值来表示总体某种特征的大致水平,这个和概率就没关系。但是概率论研究的是随机现象,而统计学恰恰涉及无处不在的随机性,因此概率论就成为精确刻画统计数据的重要工具。

举例来说,概率论研究的是一个“白盒”,你很清楚盒子中有几个红球、几个白球,即很清楚数学上的分布函数,然后推测摸到特定颜色球的可能。而数理统计要面对的是一个“黑盒”,你只看到每次从盒子里摸出来的是红球还是白球,然后猜测这个盒子中球的颜色分布。比如,盒子中红球和白球的比例各占多少?或者回答能不能认为红球占60%、白球占40%?用统计学术语来说,前一个问题叫作参数估计,后一个问题则被称为假设检验

法国数学家拉普拉斯曾说:“人生中最重要的问题,大多数情况下是概率问题”。不过,如此重要的数学理论,在过去很长一段时间里却一直没有被人们重视起来。最初研究概率论的并非数学家,而是一群赌徒和投机者,因为解决这些概率问题可以直接为他们带来金钱上的收益。直到20世纪,概率论的公理体系才比较完整地建立起来。