● 内容全面 覆盖数据爬取、数据存取、数据访问、数据预处理和数据分析等 ● 案例丰富 实战案例 案例源码,帮助读者快速掌握实操技能 ● 知识拓展 网络爬虫 机器学习,帮助读者一步提升专业技能
售 价:¥
纸质售价:¥94.60购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内 容 提 要
前 言
第1章 数据分析概述
1.1 数据分析的含义
1.2 数据分析的基础流程
1.3 数据收集
1.3.1 线下收集
1.3.2 线上收集
1.4 统计分析策略
1.4.1 描述性统计分析
1.4.2 推断性统计分析
1.4.3 探索性统计分析
1.5 数据分析方法
1.5.1 公式拆解法
1.5.2 对比分析法
1.5.3 预测分析法
1.5.4 漏斗分析法
1.5.5 象限分析法
1.6 数据挖掘的标准流程(CRISP-DM模型)
1.7 数据分析工具
1.7.1 Microsoft Excel
1.7.2 R语言
1.7.3 Python
第2章 为什么选择Python
2.1 关于Python
2.1.1 Python的起源
2.1.2 Python 2和Python 3
2.2 了解Python的特点
2.2.1 简单易学
2.2.2 自由开放
2.2.3 解释型语言
2.2.4 封装与扩展性
2.3 Python在数据分析上的优势
2.3.1 自由的数据结构
2.3.2 黏合剂Python
2.3.3 丰富的第三方库
2.4 数据分析的第三方库
2.4.1 NumPy
2.4.2 Pandas
2.4.3 Matplotlib
2.4.4 SciPy
2.4.5 Scikit-learn
2.5 网络爬虫的第三方库
2.5.1 Request
2.5.2 lxml
2.5.3 html5lib
2.5.4 BeautifulSoup
2.5.5 Scrapy
第3章 Python编程基础
3.1 安装与配置
3.1.1 在Windows操作系统下安装Python
3.1.2 在macOS下安装Python
3.1.3 在GNU/Linux操作系统下安装Python
3.1.4 安装及更新Python库
3.1.5 集成开发环境
3.2 Hello World!
3.2.1 Python解释器
3.2.2 运行IPython
3.3 基础语法
3.3.1 缩进
3.3.2 注释
3.3.3 标识符
3.3.4 关键字
3.4 变量和数据类型
3.4.1 变量赋值
3.4.2 布尔型
3.4.3 数值类型
3.4.4 字符串
3.5 内置的数据结构
3.5.1 集合
3.5.2 元组
3.5.3 列表
3.5.4 字典
3.6 控制流
3.6.1 条件语句
3.6.2 循环语句
3.6.3 break和continue关键字
3.7 函数
3.7.1 函数定义
3.7.2 函数调用
3.7.3 lambda函数
3.8 类
3.8.1 类定义
3.8.2 类的实例化
3.8.3 类的属性访问
3.8.4 类的方法调用
3.9 文件操作
3.9.1 打开和关闭文件
3.9.2 读写文件
第4章 NumPy数组:基础篇
4.1 数组对象
4.1.1 对象属性
4.1.2 数据类型
4.2 创建数组
4.2.1 通用的创建方式
4.2.2 填充数组
4.2.3 对角矩阵
4.2.4 空数组
4.2.5 等差数组
4.2.6 随机数组
4.3 数组访问
4.3.1 基础索引
4.3.2 数组切片
4.3.3 索引切片
4.4 数组更新
4.4.1 更新数组元素
4.4.2 插入数组元素
4.4.3 删除数组元素
4.4.4 复制数组
4.5 数组变换
4.5.1 数组重塑
4.5.2 轴变换
4.5.3 数组合并:拼接
4.5.4 数组合并:堆叠
4.5.5 数组拆分
4.6 矩阵运算
4.6.1 矩阵对象
4.6.2 矩阵乘法
4.6.3 逆矩阵和共轭矩阵
4.6.4 数值特征和特征值
4.6.5 矩阵分解
4.7 数组运算
4.7.1 算术运算
4.7.2 绝对值
4.7.3 指数和对数
4.7.4 三角和反三角函数
4.8 聚合统计
4.8.1 求和与乘积
4.8.2 均值和标准差
4.8.3 最大值和最小值
4.8.4 中位数和百分位数
4.8.5 逻辑统计函数
4.8.6 多维数组的聚合
第5章 NumPy数组:进阶篇
5.1 NumPy的高效运算
5.1.1 快速的矢量化计算
5.1.2 灵活的广播机制
5.1.3 广播的规则
5.2 通用函数
5.2.1 初识通用函数
5.2.2 通用函数的实例方法
5.2.3 定义新的通用函数
5.3 数组形式的条件判断
5.3.1 布尔表达式
5.3.2 where函数
5.3.3 where参数
5.4 数组的高级索引
5.4.1 布尔索引
5.4.2 Fancy索引
5.4.3 索引组合
5.5 数组排序
5.5.1 直接排序
5.5.2 间接排序
5.5.3 分区排序
5.6 结构化数组
5.6.1 结构化数组的创建
5.6.2 结构化数组的索引访问
5.6.3 记录数组
第6章 Pandas:数据处理
6.1 Pandas数据结构
6.1.1 Series对象
6.1.2 DataFrame对象
6.1.3 索引对象
6.2 数据索引和选取
6.2.1 Series中的数据选取
6.2.2 DataFrame中的数据选取
6.3 处理缺失数bb据
6.3.1 表示缺失数据的策略
6.3.2 Pandas中的缺失数据
6.3.3 对缺失值的操作
6.4 数据集合并
6.4.1 append函数
6.4.2 concat函数
6.4.3 join函数
6.4.4 merge函数
6.5 分层索引
6.5.1 分层索引:从一维到多维
6.5.2 分层索引的构建方法
6.5.3 多层级切片
6.5.4 重新排列分层索引
第7章 Pandas:数据分析
7.1 Pandas中的数组运算
7.1.1 Pandas中的通用函数
7.1.2 索引保留
7.1.3 索引对齐
7.1.4 Series和DataFrame之间的运算
7.2 数据聚合
7.2.1 基础的聚合操作
7.2.2 灵活的聚合函数
7.2.3 基于行索引的分组聚合
7.3 数据分组
7.3.1 分组对象
7.3.2 分组键
7.3.3 分组聚合
7.3.4 过滤分组数据
7.3.5 基于分组的数据转换
7.4 数据透视表
7.4.1 透视表和分组对象
7.4.2 定制透视表
7.4.3 透视表的进阶用法
7.5 时间序列
7.5.1 时间数据的类型
7.5.2 时间序列的索引
7.5.3 时间序列的数据访问
第8章 数据的导入导出
8.1 文本数据
8.1.1 从文本导入数据
8.1.2 导出数据到文本
8.2 Excel数据
8.2.1 从电子表格导入数据
8.2.2 导出数据到电子表格
8.3 网络数据
8.3.1 JSON格式
8.3.2 XML和HTML格式
8.4 数据库
8.4.1 关系数据库
8.4.2 数据库API
8.5 Pandas数据对象的导入导出
8.5.1 分隔文本格式
8.5.2 Excel数据格式
8.5.3 JSON数据格式
8.5.4 读取数据库
第9章 数据可视化
9.1 Matplotlib绘图的基础设置
9.1.1 绘图面板
9.1.2 图形样式
9.1.3 坐标轴
9.1.4 图例
9.2 Pandas绘图接口
9.2.1 折线图
9.2.2 柱状图
9.2.3 直方图和密度图
9.2.4 散点图
第10章 实战:数据预处理
10.1 数据导入
10.1.1 数据描述
10.1.2 数据读取
10.1.3 数据合并
10.2 数据清洗
10.2.1 冗余数据
10.2.2 缺失数据
10.2.3 无效数据
10.3 数据转换
10.3.1 数据类型转换
10.3.2 分层索引
10.3.3 生成时间序列
10.4 数据过滤
10.5 数据导出
第11章 实战:数据分析
11.1 时间序列分析
11.1.1 导入时间序列
11.1.2 生成时间区间数据
11.1.3 时间窗函数
11.2 统计分析
11.2.1 描述性统计
11.2.2 聚合统计
11.2.3 分组统计
11.3 关联分析
11.3.1 数据联合
11.3.2 协方差和相关系数
11.4 透视表分析
11.4.1 数据集整合
11.4.2 分层透视表
第12章 Python网络爬虫
12.1 Robots协议
12.2 数据抓取
12.2.1 最基本的数据抓取
12.2.2 处理登录请求
12.2.3 连接超时
12.3 Scrapy库
12.3.1 搭建工程项目
12.3.2 编写爬虫
12.3.3 数据选择器
12.3.4 定义数据对象
12.3.5 数据管道
第13章 Scikit-learn机器学习
13.1 选择合适的机器学习模型
13.2 数据预处理
13.2.1 标准化
13.2.2 归一化
13.2.3 正态化
13.3 监督学习
13.3.1 线性模型
13.3.2 最近邻算法
13.3.3 支持向量机
13.3.4 随机森林
13.4 无监督学习
13.4.1 K-means聚类算法
13.4.2 主成分分析(PCA)
13.4.3 高斯混合模型
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜