更新时间:2024-12-27 21:58:30
封面
版权信息
内容简介
作者简介
前言
第1部分 机器学习的数学理论理解
第1讲 这个不确定的世界如何描述
1.1 概率、几率及期望
1.2 概率函数、概率分布函数和概率密度函数
1.3 条件概率、联合概率以及贝叶斯公式
1.4 本讲小结
第2讲 数据的形态描述
2.1 正态分布
2.2 混合高斯分布
2.3 伯努利分布及二项分布
2.4 泊松分布
2.5 指数分布
2.6 幂律分布
2.7 以上分布的总结和联系
2.8 本讲小结
第3讲 信息的数学表达
3.1 自信息
3.2 信息熵
3.3 信息增益
3.4 相对熵
3.5 交叉熵
3.6 基尼指数(不纯度)
3.7 本讲小结
第4讲 随机变量的相关性和重要性
4.1 数值型变量之间的相关性
4.2 类别型变量之间的相关性
4.3 证据权重和信息值
4.4 本讲小结
第5讲 抓住主要矛盾——降维技术理论
5.1 主成分分析
5.2 线性判别分析
5.3 奇异值分解
5.4 自编码器
5.5 PCA、SVD和AE是亲戚
5.6 傅里叶变换
5.7 本讲小结
第6讲 采样方法
6.1 拒绝采样
6.2 马尔可夫链蒙特卡罗采样
6.3 Metropolis-Hastings采样
6.4 吉布斯采样
6.5 汤普森采样
6.6 上采样-人工合成数据策略
6.7 本讲小结
第7讲 抬头看路低头拉车的迭代方法
7.1 迭代求解
7.2 梯度下降法
7.3 牛顿法及其改进算法
7.4 Adam(Adaptive Moment Estimation)方法
7.5 本讲小结
第8讲 经典最优化问题求解方法
8.1 最小二乘估计
8.2 最大似然估计
8.3 最大后验概率
8.4 期望最大化方法
8.5 最大熵模型
8.6 本讲小结
第2部分 机器学习模型、方法及本质
第9讲 机器学习的方法论
9.1 总体方法论
9.2 建模分析的一般步骤
9.3 模型和算法
9.4 本讲小结
第10讲 数据准备
10.1 厘清数据来源
10.2 数据的探索性分析
10.3 本讲小结
第11讲 异常检测和处理
11.1 什么是异常值
11.2 异常检测面临的挑战
11.3 异常的种类
11.4 异常检测的应用领域
11.5 异常检测的方法
11.6 本讲小结
第12讲 特征数据的预处理
12.1 特征标准化
12.2 连续变量离散化
12.3 离散型特征处理
12.4 本讲小结
第13讲 特征的选择、提取和构造
13.1 为什么要进行特征的选择、提取和构造
13.2 特征的选择
13.3 特征的提取和构造
13.4 本讲小结
第14讲 机器学习模型——逻辑回归和梯度提升决策树
14.1 逻辑回归
14.2 梯度提升决策树
第15讲 机器学习模型——概率图模型
15.1 概述
15.2 概率图模型族谱及特征
15.3 两个典型的概率图模型
第16讲 机器学习模型——强化学习
16.1 ε贪婪算法
16.2 置信区间上界算法
16.3 汤普森采样