2.1.2 机器学习的分类
机器学习主要包括监督学习(supervised learning)、无监督学习(unsupervised learning)、半监督学习(semi-supervised learning)、主动学习(active learning)和强化学习(reinforcement learning)5种类别。机器学习算法包括K-means、随机森林和朴素贝叶斯等算法,这些算法本质上可以看成函数,函数的输入是数据本身,输出是期望的结果。
(1)监督学习。
监督学习又称为有指导学习,是指有结果度量(outcome measurement)的监督学习过程,主要利用已知某种特性的样本(x,y)进行训练,建立一个数学模型,求解f:x→y,预测未知样本。监督学习大致分为分类(classification)和回归(regression)两类。分类问题中的标签是离散值,如果标签只有两个值,则称为二分类,如用户“购买”和“不购买”;如果标签有多个值,则称为多分类。回归问题中的标签是连续值,例如在预测郑州市房屋价格的问题中,价格作为标签就是一个连续值,该问题属于回归问题。常见的监督学习算法包括决策树、人工神经网络、支持向量机、自适应提升(boosting)和自助投票(bagging)等。
(2)无监督学习。
无监督学习一般用于监督学习前期的数据处理环节,它从原始数据集中抽取出必要的标签信息,只能观察特征,没有结果度量,此时只能利用从总体中抽取的样本信息,对总体做出某种判断以及描述。无监督学习的目的是提取数据中的隐含结构和规模,它并不需要某个变量和训练集,常见的无监督学习算法有K-means、聚类分析、关联分析等。
(3)半监督学习。
半监督学习是监督学习和无监督学习的结合,利用少量已标注的样本和大量未标注的样本进行训练和测试,对未标注的样本的标识做出合理的推断,经常采用归纳—演绎法,即先利用已标注数据去分析并给出一般性的规律,然后利用规律去推断得出相关未标注数据的标识。半监督学习一般基于平滑假设、聚类假设和流行假设实现。
(4)主动学习。
主动学习使用较小的训练样本获得性能较好的分类器,主要通过一定的算法查询最有用的未标注样本,并交由专家进行标注,然后用查询到的样本训练模型提高模型的精确度。
(5)强化学习。
在强化学习中,输入数据被作为对模型的反馈(不像监督学习模型,输入数据仅作为一个检查模型正确与否的方式)。在强化学习中,输入数据直接反馈到模型,模型必须对此立刻做出调整。强化学习的常见应用包括动态系统和机器人控制等。常用算法包括Q-learning和时间差分学习(temporal-difference learning)等。