上QQ阅读APP看书,第一时间看更新
3.6 本章小结
在前面的内容中介绍了机器学习的分类和常用算法。大家对最常用的算法原理有了一定的理解。除了最基本的算法,机器学习在实际应用中还有很多其他方面需要注意。
机器学习算法的分类是多种多样的,可采用的算法也很多,在实际工作中采用何种算法是一个令程序设计人员非常头疼的问题。
在前文介绍机器学习时已经举了例子,使用线性回归可以量化地计算出房屋面积、卧室与房屋价格之间的关系。也许这个关系不太精确,但是可以较好地反映出彼此之间是否有联系,以更好地帮助读者将一些不能够直接反映的量转化为量化处理。
除了一般性的训练方法外,线性回归对于特征值的选择也是较为简单的。可以选择一般性的数据作为其计算的特征值,在计算时也应该选择比较容易计算的拟合方程来构建机器学习模型。线性回归均能够满足这些要求。
回到前面介绍的线性回归算法,其好处在于线性回归的计算速度非常快,一般模型建立的时间可以压缩到几分钟,甚至于数百吉字节的网络大数据也可以在数小时完成,非常有利于借助分布式系统对大数据进行处理。其次,对于一些问题的求解,线性回归方法能够比其他算法有更好的性能。综合起来看,一些问题并不需要复杂的算法模型,而是需要对数据的复杂度和数据集的大小进行综合考虑。所以,线性回归模型能够取得更好的整体模型算法效果。