Python数据分析从小白到专家
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.5 中坚力量:Sklearn和Statsmodels库简介

Sklearn和Statsmodels是用于回归分析和统计计算的第三方库,它们的数学基础是数理统计和概率分析。Sklearn和Statsmodels不仅是数据分析的利器,一般还作为机器学习常用的第三方库。爬虫是为数据分析服务的,没有意义的数据就是一堆占用机器内存的垃圾,所以,爬虫得到的数据往往会经过数据分析的过程,然后投入机器学习中,即进入生产环境。

在Python中,Statsmodels和Sklearn是统计建模分析的核心工具包,其包括了几乎所有常见的各种回归模型、非参数模型和估计、时间序列分析和建模及空间面板模型,其功能非常强大,使用起来也相当便捷。