商用机器学习:数据科学实践
上QQ阅读APP看书,第一时间看更新

第2章 无监督学习

正如第1章中讲到的,无监督学习主要用于发现数据的规律。该学习方式的目标不是预测某个目标变量的值,而是了解数据的结构以及聚类方式。这一学习方式在商业模式中被广泛运用。例如,银行常用无监督学习将客户进行聚类,以便更好地了解顾客群并进行定制化服务。一类顾客群为在近期有房屋抵押贷款需求的年轻夫妇,另一类顾客群为中产阶级,家庭年收入为250 000~500 000美元,这部分消费者可能对资产管理类服务更感兴趣。

在本章中我们将以海外投资者对国家投资风险等级的分类为例,简单介绍k-均值聚类算法的运算步骤。后续还会涉及聚类分析的具体方法以及主成分分析法,该方法在监督和无监督学习中都非常行之有效。