Python机器学习(原书第3版)
上QQ阅读APP看书,第一时间看更新

第5章 通过降维压缩数据

在第4章中,我们介绍了利用不同的特征选择技术来降低数据集维度的各种方法。特征提取是特征选择之外实现降维的另一种方法。本章将学习三种基本技术,它们有助于通过将数据集变换到新的低维特征子空间来概括数据集的信息内容。数据压缩是机器学习的一个重要课题,它有助于存储和分析现代科技时代所产生和收集的大量数据。

本章将主要涵盖下述几个方面:

  • 无监督数据压缩的主成分分析(principal component analysis, PCA)。
  • 线性判别分析(linear discriminant analysis, LDA)作为最大化类可分性的监督降维技术。
  • 利用核主成分分析(kernel principal component analysis, KPCA)进行非线性降维。