上QQ阅读APP看书,第一时间看更新
1.3.2 无监督学习
无监督学习(Unsupervised Learning)又称为非监督学习,是在没有训练数据集的情况下,对没有标签的数据进行分析并建立模型,发现数据本身的分布特点。与监督学习不同,无监督学习事先没有对数据进行标注,因此无法预测任务,而适合数据分析。
无监督学习分为数据聚类和特征降维。
1.数据聚类
数据聚类(Clustering)是无监督学习的主流应用之一,其目的也是把数据进行分类。对没有标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。
2.特征降维
特征降维(Dimensionality Reduction)是对事物的特性进行压缩和筛选,使用较少的特征概括该数据的重要特性。
机器学习模式总结如表1-4所示。
表1-4 机器学习模式总结