更新时间:2019-10-21 12:09:36
封面
版权信息
前言
本书的主要内容
本书的读者对象
测试环境及代码
联系作者
致谢
读者服务
1 准备
1.1 开发环境搭建
1.1.1 在Ubuntu系统下搭建Python集成开发环境
1.1.2 在Windows系统下搭建Python集成开发环境
1.1.3 三种安装第三方库的方法
1.2 Python基础语法介绍
1.2.1 if__name__=='__main__'
1.2.2 列表解析式
1.2.3 装饰器
1.2.4 递归函数
1.2.5 面向对象
1.3 The Zen of Python
参考文献
2 数据的获取
2.1 爬虫简介
2.2 数据抓取实践
2.2.1 请求网页数据
2.2.2 网页解析
2.2.3 数据的存储
2.3 爬虫进阶
2.3.1 异常处理
2.3.2 robots.txt
2.3.3 动态UA
2.3.4 代理IP
2.3.5 编码检测
2.3.6 正则表达式入门
2.3.7 模拟登录
2.3.8 验证码问题
2.3.9 动态加载内容的获取
2.3.10 多线程与多进程
2.4 爬虫总结
3 数据的存取与清洗
3.1 数据存取
3.1.1 基本文件操作
3.1.2 CSV文件的存取
3.1.3 JSON文件的存取
3.1.4 XLSX文件的存取
3.1.5 MySQL数据库文件的存取
3.2 NumPy
3.2.1 NumPy简介
3.2.2 NumPy基本操作
3.3 pandas
3.3.1 pandas简介
3.3.2 Series与DataFrame的使用
3.3.3 布尔值数组与函数应用
3.4 数据的清洗
3.4.1 编码问题
3.4.2 缺失值的检测与处理
3.4.3 去除异常值
3.4.4 去除重复值与冗余信息
3.4.5 注意事项
4 数据的分析及可视化
4.1 探索性数据分析
4.1.1 基本流程
4.1.2 数据降维
4.2 机器学习入门
4.2.1 机器学习简介
4.2.2 决策树——机器学习算法的应用
4.3 手动实现KNN算法
4.3.1 特例——最邻近分类器
4.3.2 KNN算法的完整实现
4.4 数据可视化
4.4.1 高质量作图工具——matplotlib
4.4.2 快速作图工具——pandas与matplotlib
4.4.3 简捷作图工具——seaborn与matplotlib
4.4.4 词云图
5 Python与生活
5.1 定制一个新闻提醒服务
5.1.1 新闻数据的抓取
5.1.2 实现邮件发送功能
5.1.3 定时执行及本地日志记录
5.2 Python与数学
5.2.1 估计π值
5.2.2 三门问题
5.2.3 解决LP与QP问题(选读)
5.3 QQ群聊天记录数据分析