开放网络知识计算:模型、方法与应用
上QQ阅读APP看书,第一时间看更新

第3章 概率论

3.1 概述

概率论是一门很古老的数学学科,旨在讨论各种随机现象中的规律性。其中,随机现象就是在一定条件下,在个别实验或观察中呈现不确定性,但在大量重复实验或观察中其结果又具有一定规律性的现象。网络大数据的迅速增长,使得通过数据发现数据中隐藏规律成为亟待解决的问题,无处不在的数据只有挖掘出其隐藏规律才能产生价值,因此,概率论作为分析和总结规律的基础学科,成为网络大数据研究的理论基础。

而概率统计的一个基础理论就是贝叶斯定理。贝叶斯定理是应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。就是说,当不能准确知悉一个事物的本质时,可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。用数学语言表达就是:支持某项属性的事件发生得越多,则该属性成立的可能性就越大。贝叶斯定理给出了最小化误差的最优解决方法,可用于分类和预测,是网络大数据分析中重要的基础理论之一。

因此,本章首先介绍概率的概念,从而引出条件概率和全概率公式,进而对贝叶斯定理进行详细的介绍。