1.3.2 无监督学习_Python自然语言处理（微课版）-QQ阅读男生科幻网

上QQ阅读APP看书，第一时间看更新

无监督学习（Unsupervised Learning）又称为非监督学习，是在没有训练数据集的情况下，对没有标签的数据进行分析并建立模型，发现数据本身的分布特点。与监督学习不同，无监督学习事先没有对数据进行标注，因此无法预测任务，而适合数据分析。

无监督学习分为数据聚类和特征降维。

数据聚类（Clustering）是无监督学习的主流应用之一，其目的也是把数据进行分类。对没有标注的数据集，按数据的内在相似性将数据集划分为多个类别，使类别内的数据相似度较大而类别间的数据相似度较小。

特征降维（Dimensionality Reduction）是对事物的特性进行压缩和筛选，使用较少的特征概括该数据的重要特性。

机器学习模式总结如表1-4所示。

表1-4 机器学习模式总结