更新时间:2021-05-19 18:14:26
封面
版权信息
内容简介
前言
第1章 数据分析存在的意义
1.1 数据分析与Python
1.1.1 数据科学和数据分析的始末
1.1.2 为什么使用Python作为脚本
1.2 本书的主要内容
1.2.1 数据分析基础:NumPy、Pandas和Matplotlib库概述
1.2.2 数据处理:NumPy库简介
1.2.3 数据处理:Pandas库简介
1.2.4 图表绘制:Matplotlib库简介
1.2.5 中坚力量:Sklearn和Statsmodels库简介
第2章 开始前的准备
2.1 Python 3.7.6的安装
2.1.1 Python3和Python2的区别
2.1.2 在Windows 10系统中下载并安装Python 3.7.6
2.1.3 手动配置环境变量
2.2 pip的安装
2.2.1 pip是什么
2.2.2 在Windows系统中下载和安装pip
2.2.3 使用pip命令下载和管理pip
第3章 Python编程基础
3.1 Python编程初识
3.1.1 第一个Python程序
3.1.2 整型、浮点型、布尔型与复数型
3.1.3 不同数据类型之间的运算法则
3.1.4 Python中的常用内建函数
3.2 Python编程常用类型
3.2.1 Python的列表
3.2.2 Python的元组
3.2.3 Python的字典
3.2.4 Python的字符串
3.3 Python的条件、循环和分支语句以及异常处理
3.3.1 Python的编程风格
3.3.2 错误、异常和异常处理
3.3.3 条件语句:if、if-else和elif
3.3.4 循环语句:while和for
3.4 其他关于Python的重要知识点
3.4.1 匿名函数lambda
3.4.2 Python自定义类与打印函数
第4章 线性代数知识和第三方库NumPy的使用
4.1 必要的线性代数知识
4.1.1 线性代数综述
4.1.2 行列式
4.1.3 矩阵及矩阵的运算
4.1.4 矩阵的初等变换与秩、向量组与线性相关
4.1.5 相似矩阵
4.2 NumPy库的基础操作
4.2.1 NumPy库的安装和基本方法
4.2.2 创建一个数组
4.2.3 索引、切片和迭代
4.2.4 拼合、划分一个矩阵
4.2.5 深拷贝、浅拷贝与不拷贝
4.3 用NumPy库实现矩阵运算
4.3.1 矩阵基本运算一(矩阵加法、矩阵减法、矩阵数乘)
4.3.2 矩阵基本运算二(矩阵相乘、逆矩阵、矩阵的特征值和特征向量)
第5章 使用正则表达式处理数据
5.1 RE模块简述
5.1.1 正则表达式(RE)模块使用的符号
5.1.2 正则表达式的匹配规则
5.2 使用正则表达式模块
5.2.1 匹配对象方法group()和groups()的用法
5.2.2 使用管道符进行匹配
5.2.3 使用*、+、?、{}符号实现多个条件匹配
5.2.4 一些特殊格式的正则表达式匹配模式
第6章 使用Pandas库处理数据
6.1 Pandas库简述
6.1.1 Pandas库能做什么
6.1.2 Pandas库功能简述
6.2 三种格式的文件后缀简述
6.2.1 什么是CSV文件
6.2.2 Python自带的CSV模块
6.2.3 为什么要将TXT和Excel文件转化为CSV文件
6.3 处理.csv格式的数据
6.3.1 用read_csv()和head()读取CSV文件并显示其行/列
6.3.2 查看列数、维度以及切片操作
6.3.3 读取特定的列以及列的改值操作
6.3.4 求某一列的最大值、最小值、算术平均数以及数据的排序
6.3.5 Pandas库的写入操作——to_csv()方法
6.4 处理非.csv格式的数据
6.4.1 用Pandas库读取TXT文件
6.4.2 用Pandas库读取Excel文件
6.5 Pandas库的其他常用操作
6.5.1 新增DataFrame数据结构的意义
6.5.2 创建与遍历DataFrame数据结构
6.5.3 检索已有的DataFrame数据结构
6.5.4 DataFrame数据结构的选择操作
6.5.5 处理DataFrame数据结构中的缺失数据
第7章 使用Matplotlib库实现数据可视化
7.1 Matplotlib库简述
7.1.1 Matplotlib库的安装
7.1.2 Matplotlib库常见的问题
7.2 Matplotlib库的基本方法
7.2.1 设定x轴与y轴的相关内容
7.2.2 “点”和“线”样式的设定
7.3 使用Matplotlib库绘制图表
7.3.1 绘制柱状图
7.3.2 绘制直方图