万本电子书0元读

万本电子书0元读

顶部广告

从零开始学Python数据分析电子书

售       价:¥

纸质售价:¥49.80购买纸书

36人正在读 | 0人评论 6.8

作       者:罗攀

出  版  社:机械工业出版社

出版时间:2018-07-01

字       数:7.8万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
网络中的信息是很庞大的。如何提取这些信息?如何分析这些信息?这都需要用到数据分析技术。而数据分析技术的*语言是Python,而本书便是一本适合“小白”学习Python数据分析的门图书,书中不仅有各种分析框架的使用技巧,而且也有各类数据图表的绘制方法。本书通过讲解多个案例,让读者体验数据背后的乐趣。 本书共11章,核心内容包括Python数据分析环境安装、NumPy基础、pandas基础、外部数据读取与存储、数据清洗与整理、数据分组与聚合、matplotlib可视化、seaborn可视化、pyecharts可视化、时间序列、网站日志分析综合案例等。 本书适合Python数据分析的初学者和爱好者阅读,也适合作为各类院校相关专业的教学用书,同时还适合相关社会培训机构作为Python数据分析的培训教材或者参考书。 本书特色: 手把手带领“小白”轻松门Python数据分析 全面涵盖数据分析的流程、工具、框架和方法,内容新,实战案例多 详细介绍从数据读取到数据清洗,以及从数据处理到数据可视化等实用技术 赠送400分钟配套教学视频、补充学习文档、素材文件、源文件和PPT等超值资源 详解9个有较高应用价值的Python数据分析项目实战案例 详解数据分析的3大模块:NumPy、pandas库和matplotlib库 详解Python数据分析集成环境Anaconda的安装和使用,降低学习门槛 本书精华内容: Python环境搭建与使用 NumPy门和实战 pandas门和实战 外部数据的读取与存储 数据清洗与整理 数据分组与聚合 matplotlib可视化 seaborn可视化 pyecharts可视化 时间序列 9个综合实战案例: 利用NumPy行图像变换 小费数据集分析 Iris数据集分析 巴尔的摩公务员工资数据集分析 星巴克店铺数据集分析 泰坦尼克号的生还数据分析 糗事百科用户数据分析 自行车租赁数据分析 网站日志数据分析 赠送超值配套资源: 本书配套教学视频(400分钟) 本书实例源代码文件 补充学习文档(地图绘制技术) 本书配套素材文件 本书教学PPT<br/>【作者】<br/>罗攀  知名论坛Python爬虫专题管理员。擅长Python爬虫、Python数据分析与挖掘等技术。曾经在CSDN等多个知名博客网站上发表了多篇技术文章,深受读者的喜爱。参与编写并出版了《从零始学Python网络爬虫》一书。目前从事线上Python网络爬虫的培训工作。<br/>
目录展开

前言

本书特色

本书内容

本书配套资源获取方式

适合阅读本书的读者

第1章 Python环境搭建与使用

1.1 Anaconda的安装和使用

1.1.1 Anaconda的安装

1.1.2 Anaconda的使用

1.2 Jupyter Notebook的使用

1.2.1 更改工作空间

1.2.2 界面介绍与使用

第2章 NumPy入门和实战

2.1 ndarray多维数组

2.1.1 创建ndarray数组

2.1.2 ndarray对象属性

2.1.3 ndarray数据类型

2.1.4 数组变换

2.1.5 NumPy的随机数函数

2.2 数组的索引和切片

2.2.1 数组的索引

2.2.2 数组的切片

2.2.3 布尔型索引

2.2.4 花式索引

2.3 数组的运算

2.3.1 数组和标量间的运算

2.3.2 通用函数

2.3.3 条件逻辑运算

2.3.4 统计运算

2.3.5 布尔型数组运算

2.3.6 排序

2.3.7 集合运算

2.3.8 线性代数

2.4 数组的存取

2.4.1 数组的存储

2.4.2 数组的读取

2.5 综合示例——图像变换

第3章 pandas入门和实战

3.1 pandas数据结构

3.1.1 创建Series数据

3.1.2 创建DataFrame数据

3.1.3 索引对象

3.2 pandas索引操作

3.2.1 重新索引

3.2.2 更换索引

3.2.3 索引和选取

3.2.4 操作行和列

3.3 pandas数据运算

3.3.1 算术运算

3.3.2 函数应用和映射

3.3.3 排序

3.3.4 汇总与统计

3.3.5 唯一值和值计数

3.4 层次化索引

3.4.1 层次化索引简介

3.4.2 重排分级顺序

3.4.3 汇总统计

3.5 pandas可视化

3.5.1 线形图

3.5.2 柱状图

3.5.3 直方图和密度图

3.5.4 散点图

3.6 综合示例——小费数据集

3.6.1 数据分析流程

3.6.2 数据来源

3.6.3 定义问题

3.6.4 数据清洗

3.6.5 数据探索

第4章 外部数据的读取与存储

4.1 文本数据的读取与存储

4.1.1 CSV文件的读取

4.1.2 TXT文件的读取

4.1.3 文本数据的存储

4.2 JSON和Excel数据的读取与存储

4.2.1 JSON数据的读取与存储

4.2.2 Excel数据的读取与存储

4.3 数据库的读取与存储

4.3.1 连接数据库

4.3.2 读取数据库

4.3.3 存储数据库

4.4 Web数据的读取

4.4.1 读取HTML表格

4.4.2 网络爬虫

第5章 数据清洗与整理

5.1 数据清洗

5.1.1 处理缺失值

5.1.2 移除重复数据

5.1.3 替换值

5.1.4 利用函数或映射进行数据转换

5.1.5 检测异常值

5.1.6 虚拟变量

5.2 数据合并和重塑

5.2.1 merge合并

5.2.2 concat连接

5.2.3 combine_first合并

5.2.4 数据重塑

5.3 字符串处理

5.3.1 字符串方法

5.3.2 正则表达式

5.4 综合示例——Iris数据集

5.4.1 数据来源

5.4.2 定义问题

5.4.3 数据清洗

5.4.4 数据探索

第6章 数据分组与聚合

6.1 数据分组

6.1.1 GroupBy简介

6.1.2 按列名分组

6.1.3 按列表或元组分组

6.1.4 按字典分组

6.1.5 按函数分组

6.2 聚合运算

6.2.1 聚合函数

6.2.2 多函数应用

6.3 分组运算

6.3.1 transform方法

6.3.2 apply方法

6.4 数据透视表

6.4.1 透视表

6.4.2 交叉表

6.5 综合实例——巴尔的摩公务员工资数据集

6.5.1 数据来源

6.5.2 定义问题

6.5.3 数据清洗

6.5.4 数据探索

第7章 matplotlib可视化

7.1 线形图

7.1.1 基本使用

7.1.2 颜色与线形

7.1.3 点标记

7.2 柱状图

7.2.1 基本使用

7.2.2 刻度与标签

7.2.3 图例

7.3 其他基本图表

7.3.1 散点图

7.3.2 直方图

7.4 自定义设置

7.4.1 图表布局

7.4.2 文本注解

7.4.3 样式与字体

7.5 综合示例——星巴克店铺数据集

7.5.1 数据来源

7.5.2 定义问题

7.5.3 数据清洗

7.5.4 数据探索

第8章 seaborn可视化

8.1 样式与分布图

8.1.1 seaborn样式

8.1.2 坐标轴移除

8.1.3 单变量分布图

8.1.4 多变量分布图

8.2 分类图

8.2.1 分类散点图

8.2.2 箱线图与琴形图

8.2.3 柱状图

8.3 回归图与网格

8.3.1 回归图

8.3.2 网格

8.4 综合示例——泰坦尼克号生还者数据

8.4.1 数据来源

8.4.2 定义问题

8.4.3 数据清洗

8.4.4 数据探索

第9章 pyecharts可视化

9.1 基础图表

9.1.1 pyecharts安装

9.1.2 散点图

9.1.3 折线图

9.1.4 柱状图

9.2 其他图表

9.2.1 饼图

9.2.2 箱线图

9.3 综合示例——糗事百科用户数据

9.3.1 数据来源

9.3.2 定义问题

9.3.3 数据清洗

9.3.4 数据探索

第10章 时间序列

10.1 datetime模块

10.1.1 datetime构造

10.1.2 数据转换

10.2 时间序列基础

10.2.1 时间序列构造

10.2.2 索引与切片

10.3 日期

10.3.1 日期范围

10.3.2 频率与移动

10.4 时期

10.4.1 时期基础

10.4.2 频率转换

10.4.3 时期数据转换

10.5 频率转换与重采样

10.5.1 重采样

10.5.2 降采样

10.5.3 升采样

10.6 综合示例——自行车租赁数据

10.6.1 数据来源

10.6.2 定义问题

10.6.3 数据清洗

10.6.4 数据探索

第11章 综合案例——网站日志分析

11.1 数据来源

11.1.1 网站日志解析

11.1.2 日志数据清洗

11.2 日志数据分析

11.2.1 网站流量分析

11.2.2 状态码分析

11.2.3 IP地址分析

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部