上QQ阅读APP看书,第一时间看更新
3.5.4 其他增强手段
对于图像数据集,还有一些其他的数据增强方法,包括:
·改变图像的投影
·添加压缩噪声(量化图像)
·除了高斯噪声,还可以添加其他类型的噪声,如椒盐噪声、乘性噪声等
·对图像进行不同距离的随机平移
但最强大的增强是所有这些方法的组合!
图像数据很有趣,因为这些数据在局部区域具有高度相关性。然而,对于一般的非图像数据集,如心脏病数据集,我们通常需要使用其他方式实现对数据的增强,例如:
·添加低方差的高斯噪声
·添加压缩噪声(量化)
·通过计算概率密度函数的方式获得新的样本数据点
对于其他特殊类型的数据集,如文本数据集,也可以这样做:
·用同义词替换一些单词
·删除一些单词
·添加包含错误的单词
·去掉标点符号(如果不关心正确的语言结构)
要想了解更多关于这些技术和其他数据增强技术的信息,请查阅与特定类型数据相关的最新在线资源。
现在让我们深入研究一些关于数据降维的技术,这些技术可以用来缓解高维和高度相关数据集的问题。