人工智能数学基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.3 概率论

概率论是学习人工智能必备的数学知识。概率论已经替代了逻辑主义的功能,被广泛应用于人工智能算法研究。概率论代表了一种看待世界的方式,其关注的焦点是无处不在的可能性,对随机事件发生的可能性进行规范的数学描述是概率论的公理化过程。因此,机器学习算法中经常使用概率统计工具来处理不确定量或随机量。

现阶段人工智能研究需要处理的行业信息、数据、资料等都呈爆发式增长,这使概率统计成了机器学习的关键内容之一。通常人们认为数据分布是固定不变的,参数要经过计算才能得知,而贝叶斯认为数据分布具有随机性,要进行概率最大化后再计算参数。

概率论中存在两个学派,即“频率学派”和“贝叶斯学派”。两种学派的核心区别在于对先验分布的认识。频率学派认为,假设是客观存在且不会改变的,即存在固定的先验分布,只是作为观察者的我们无从知晓,因而在计算具体事件的概率时,要先确定概率分布的类型和参数,然后以此为基础进行概率推演。相比之下,贝叶斯学派则认为,固定的先验分布是不存在的,参数本身是随机数。换言之,假设本身取决于观察结果,是不确定且可以修正的。数据的作用是对假设做出不断的修正,使观察者对概率的主观认识更加接近客观实际。

目前,很多机器学习算法是以概率统计的理论为基础支撑推导出来的,比如代价函数的最小二乘形式、逻辑回归算法都基于对模型的最大似然估计。

概率论中的高斯函数及中心极限定理被广泛用于人工智能算法。独立同分布的不同随机变量之和会随变量数的增加而趋于高斯分布,因此,很多模型假设都采用高斯函数进行建模。