上QQ阅读APP看书,第一时间看更新
内容提要
本书采用理论知识与任务案例相结合的形式,系统地阐述大数据分析处理工作流程中的重要步骤,介绍大数据分析处理过程中常用的第三方库。全书共13个单元,单元1介绍大数据分析的概念等内容;单元2和单元3介绍使用numpy与pandas实现科学计算与统计分析的相关知识;单元4~单元7介绍使用pandas实现数据预处理的方法;单元8介绍使用scikit-learn构建简单的机器学习模型的方法;单元9介绍使用matplotlib、seaborn等绘制图表的方法;单元10~单元13介绍4个大数据分析处理的综合案例。单元1~单元9中,每个单元都包含相关知识部分和任务实现部分,任务实现部分一般包含多个任务的具体实现过程,每个任务后都有课堂实践,通过完成实践操作,读者可以进一步巩固所学知识。
本书既可作为高等院校大数据技术专业学生的教材,也可作为大数据技术爱好者的自学用书。