万本电子书0元读

万本电子书0元读

顶部广告

Python数据分析从入门到精通电子书

《Python数据分析从门到精通》从零基础始,提供了从Python门到成为数据分析高手所必需的各项知识。无论有没有Python基础,通过本书你都能*终成为数据分析高手。 (1)主流技术,全面解析。本书涵盖数据分析三剑客Pandas、Matplotlib和Numpy,数据可视化三大图表Matplotlib、Seaborn和Pyecharts,以及机器学习库Scikit-Learn等技术,一本书教你掌握数据分析领域的主流核心技术。 (2)由浅深,循序渐。本书引领读者按照基础知识→核心技术→高级应用→项目实战循序渐地学习,符合认知规律。

售       价:¥

纸质售价:¥87.30购买纸书

158人正在读 | 0人评论 7.5

作       者:明日科技

出  版  社:清华大学出版社

出版时间:2021-06-01

字       数:18.8万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
《Python数据分析从门到精通》全面介绍了使用Python行数据分析所必需的各项知识。全书共分为14章,包括了解数据分析、搭建Python数据分析环境、Pandas统计分析、Matplotlib可视化数据分析图表、Seaborn可视化数据分析图表、第三方可视化数据分析图表Pyecharts、图解数组计算模块NumPy、数据统计分析案例、机器学习库Scikit-Learn、注册用户分析(MySQL版)、电商销售数据分析与预测、二手房房价分析与预测,以及客户价值分析。<br/>【推荐语】<br/>《Python数据分析从门到精通》从零基础始,提供了从Python门到成为数据分析高手所必需的各项知识。无论有没有Python基础,通过本书你都能*终成为数据分析高手。 (1)主流技术,全面解析。本书涵盖数据分析三剑客Pandas、Matplotlib和Numpy,数据可视化三大图表Matplotlib、Seaborn和Pyecharts,以及机器学习库Scikit-Learn等技术,一本书教你掌握数据分析领域的主流核心技术。 (2)由浅深,循序渐。本书引领读者按照基础知识→核心技术→高级应用→项目实战循序渐地学习,符合认知规律。 (3)边学边练,学以致用。248个应用示例 20个综合案例 4个行业项目案例 136集Python零基础扫盲课,边学边练,在实践中提升技能。 (4)精彩栏目,贴心提醒。本书设置了很多“注意”“说明”“知识胶囊”等小栏目,让读者在学习的过程中更轻松地理解相关知识及概念,更快地掌握数据分析技能和应用技巧。 (5)在线解答,高效学习。在线答疑QQ及技术支持网站,不定期行在线直播课程。<br/>【作者】<br/>明日科技,全称是吉林省明日科技有限公司,是一家专业从事软件发、教育培训以及软件发教育资源整合的高科技公司,其编写的教材非常注重选取软件发中的必需、常用内容,同时也很注重内容的易学、方便性以及相关知识的拓展性,深受读者喜爱。其教材多次荣获“全行业优秀畅销品种”“全国高校出版社优秀畅销书”等奖项,多个品种长期位居同类图书销售排行榜的前列。<br/>
目录展开

封面页

书名页

版权页

内容简介

前言 Preface

第1篇 基础篇

第1章 了解数据分析

1.1 什么是数据分析

1.2 数据分析的重要性

1.3 数据分析的基本流程

1.3.1 熟悉工具

1.3.2 明确目的

1.3.3 获取数据

1.3.4 数据处理

1.3.5 数据分析

1.3.6 验证结果

1.3.7 结果呈现

1.3.8 数据应用

1.4 数据分析常用工具

1.4.1 Excel工具

1.4.2 Python语言

1.5 小结

第2章 搭建Python数据分析环境

2.1 Python概述

2.1.1 Python简介

2.1.2 Python的版本

2.2 搭建Python开发环境

2.2.1 什么是IDLE

2.2.2 安装Python

2.2.3 使用IDLE编写“Hello World”

2.2.4 配置环境变量——解决“'python'不是内部或外部命令”

2.3 集成开发环境PyCharm

2.3.1 下载PyCharm

2.3.2 安装PyCharm

2.3.3 运行PyCharm

2.3.4 创建工程目录

2.3.5 第一个Python程序“Hello World”

2.4 数据分析标准环境Anaconda

2.4.1 为什么安装Anaconda

2.4.2 下载Anaconda

2.4.3 安装Anaconda

2.5 Jupyter Notebook开发工具

2.5.1 认识Jupyter Notebook

2.5.2 新建一个Jupyter Notebook文件

2.5.3 在Jupyter Notebook中编写“Hello World”

2.6 Spyder开发工具

2.6.1 初识Spyder

2.6.2 创建项目

2.6.3 新建/重命名.py文件

2.6.4 创建第一个程序——月销量分析

2.6.5 设置图表显示方式

2.6.6 在Spyder中安装和卸载第三方库

2.7 开发工具比较与代码共用

2.7.1 开发工具比较

2.7.2 代码共用

2.8 小结

第2篇 实践篇

第3章 Pandas统计分析(上)

3.1 初识Pandas

3.1.1 Pandas概述

3.1.2 安装Pandas

3.1.3 小试牛刀——轻松导入Excel数据

3.2 Series对象

3.2.1 图解Series对象

3.2.2 创建一个Series对象

3.2.3 手动设置Series索引

3.2.4 Series的索引

3.2.5 获取Series索引和值

3.3 DataFrame对象

3.3.1 图解DataFrame对象

3.3.2 创建一个DataFrame对象

3.3.3 DataFrame重要属性和函数

3.4 导入外部数据

3.4.1 导入.xls或.xlsx文件

3.4.2 导入.csv文件

3.4.3 导入.txt文本文件

3.4.4 导入HTML网页

3.5 数据抽取

3.5.1 抽取一行数据

3.5.2 抽取多行数据

3.5.3 抽取指定列数据

3.5.4 抽取指定行、列数据

3.5.5 按指定条件抽取数据

3.6 数据的增加、修改和删除

3.6.1 增加数据

3.6.2 修改数据

3.6.3 删除数据

3.7 数据清洗

3.7.1 缺失值查看与处理

3.7.2 重复值处理

3.7.3 异常值的检测与处理

3.8 索引设置

3.8.1 索引的作用

3.8.2 重新设置索引

3.8.3 设置某列为行索引

3.8.4 数据清洗后重新设置连续的行索引

3.9 数据排序与排名

3.9.1 数据排序

3.9.2 数据排名

3.10 小结

第4章 Pandas统计分析(下)

4.1 数据计算

4.1.1 求和(sum()函数)

4.1.2 求均值(mean()函数)

4.1.3 求最大值(max()函数)

4.1.4 求最小值(min()函数)

4.1.5 求中位数(median()函数)

4.1.6 求众数(mode()函数)

4.1.7 求方差(var()函数)

4.1.8 标准差(数据标准化std()函数)

4.1.9 求分位数(quantile()函数)

4.2 数据格式化

4.2.1 设置小数位数

4.2.2 设置百分比

4.2.3 设置千位分隔符

4.3 数据分组统计

4.3.1 分组统计groupby()函数

4.3.2 对分组数据进行迭代

4.3.3 对分组的某列或多列使用聚合函数(agg()函数)

4.3.4 通过字典和Series对象进行分组统计

4.4 数据移位

4.5 数据转换

4.5.1 一列数据转换为多列数据

4.5.2 行列转换

4.5.3 DataFrame转换为字典

4.5.4 DataFrame转换为列表

4.5.5 DataFrame转换为元组

4.5.6 Excel转换为HTML网页格式

4.6 数据合并

4.6.1 数据合并(merge()方法)

4.6.2 数据合并(concat()方法)

4.7 数据导出

4.7.1 导出为.xlsx文件

4.7.2 导出为.csv文件

4.7.3 导出多个Sheet

4.8 日期数据处理

4.8.1 DataFrame的日期数据转换

4.8.2 dt对象的使用

4.8.3 获取日期区间的数据

4.8.4 按不同时期统计并显示数据

4.9 时间序列

4.9.1 重采样(Resample()方法)

4.9.2 降采样处理

4.9.3 升采样处理

4.9.4 时间序列数据汇总(ohlc()函数)

4.9.5 移动窗口数据计算(rolling()函数)

4.10 综合应用

4.10.1 案例1:Excel多表合并

4.10.2 案例2:股票行情数据分析

4.11 小结

第5章 Matplotlib可视化数据分析图表

5.1 数据分析图表的作用

5.2 如何选择适合的图表类型

5.3 图表的基本组成

5.4 Matplotlib概述

5.4.1 Matplotlib简介

5.4.2 安装Matplotlib

5.4.3 Matplotlib图表之初体验

5.5 图表的常用设置

5.5.1 基本绘图plot()函数

5.5.2 设置画布

5.5.3 设置坐标轴

5.5.4 添加文本标签

5.5.5 设置标题和图例

5.5.6 添加注释

5.5.7 调整图表与画布边缘间距

5.5.8 其他设置

5.6 常用图表的绘制

5.6.1 绘制折线图

5.6.2 绘制柱形图

5.6.3 绘制直方图

5.6.4 绘制饼形图

5.6.5 绘制散点图

5.6.6 绘制面积图

5.6.7 绘制热力图

5.6.8 绘制箱形图

5.6.9 绘制3D图表

5.6.10 绘制多个子图表

5.6.11 图表的保存

5.7 综合应用

5.7.1 案例1:双y轴可视化数据分析图表的实现

5.7.2 案例2:颜色渐变饼形图的实现

5.7.3 案例3:等高线图的实现

5.8 小结

第6章 Seaborn可视化数据分析图表

6.1 Seaborn图表概述

6.2 Seaborn图表之初体验

6.3 Seaborn图表的基本设置

6.3.1 背景风格

6.3.2 边框控制

6.4 常用图表的绘制

6.4.1 绘制折线图(relplot()函数)

6.4.2 绘制直方图(displot()函数)

6.4.3 绘制条形图(barplot()函数)

6.4.4 绘制散点图(replot()函数)

6.4.5 绘制线性回归模型(lmplot()函数)

6.4.6 绘制箱形图(boxplot()函数)

6.4.7 绘制核密度图(kdeplot()函数)

6.4.8 绘制提琴图(violinplot()函数)

6.5 综合应用

6.5.1 案例1:堆叠柱形图可视化数据分析图表的实现

6.5.2 案例2:统计双色球中奖号码热力图

6.6 小结

第7章 第三方可视化数据分析图表Pyecharts

7.1 Pyecharts概述

7.1.1 Pyecharts简介

7.1.2 安装Pyecharts

7.1.3 绘制第一张图表

7.2 Pyecharts图表的组成

7.2.1 主题风格

7.2.2 图表标题

7.2.3 图例

7.2.4 提示框

7.2.5 视觉映射

7.2.6 工具箱

7.2.7 区域缩放

7.3 Pyecharts图表的绘制

7.3.1 柱状图——Bar模块

7.3.2 折线/面积图——Line模块

7.3.3 饼形图——Pie模块

7.3.4 箱形图——Boxplot模块

7.3.5 涟漪特效散点图——EffectScatter模块

7.3.6 词云图——WordCloud模块

7.3.7 热力图——HeatMap模块

7.3.8 水球图——Liquid模块

7.3.9 日历图——Calendar模块

7.4 综合应用

7.4.1 案例1:南丁格尔玫瑰图

7.4.2 案例2:双y轴可视化数据分析图表的实现(柱形图+折线图)

7.4.3 案例3:饼形图与环形图组合图表的实现

7.5 小结

第8章 图解数组计算模块NumPy

8.1 初识NumPy

8.1.1 NumPy概述

8.1.2 安装NumPy模块

8.1.3 数组相关概念

8.2 创建数组

8.2.1 创建简单的数组

8.2.2 不同方式创建数组

8.2.3 从数值范围创建数组

8.2.4 生成随机数组

8.2.5 从已有的数组中创建数组

8.3 数组的基本操作

8.3.1 数据类型

8.3.2 数组运算

8.3.3 数组的索引和切片

8.3.4 数组重塑

8.3.5 数组的增、删、改、查

8.4 NumPy矩阵的基本操作

8.4.1 创建矩阵

8.4.2 矩阵运算

8.4.3 矩阵转换

8.5 NumPy常用统计分析函数

8.5.1 数学运算函数

8.5.2 统计分析函数

8.5.3 数组的排序

8.6 综合应用

8.6.1 案例1:NumPy实现正态分布

8.6.2 案例2:NumPy用于图像灰度处理

8.7 小结

第9章 数据统计分析案例

9.1 对比分析

9.1.1 什么是对比分析

9.1.2 案例:对比分析各品牌销量表现TOP10

9.2 同比、定比和环比分析

9.2.1 同比、定比和环比概述

9.2.2 案例1:京东电商单品销量同比增长情况分析

9.2.3 案例2:单品销量定比分析

9.2.4 案例3:单品销量环比增长情况分析

9.3 贡献度分析(帕累托法则)

9.3.1 什么是贡献度分析

9.3.2 案例:产品贡献度分析

9.4 差异化分析

9.4.1 差异化概述

9.4.2 案例:学生成绩性别差异分析

9.5 相关性分析

9.5.1 相关性概述

9.5.2 案例:广告展现量与费用成本相关性分析

9.6 时间序列分析

9.6.1 时间序列概述

9.6.2 案例:年增长趋势和季节性波动分析

9.7 小结

第3篇 高级篇

第10章 机器学习库Scikit-Learn

10.1 Scikit-Learn简介

10.2 安装Scikit-Learn

10.3 线性模型

10.3.1 最小二乘法回归

10.3.2 岭回归

10.4 支持向量机

10.5 聚类

10.5.1 什么是聚类

10.5.2 聚类算法

10.5.3 聚类模块

10.5.4 聚类数据生成器

10.6 小结

第4篇 项目篇

第11章 注册用户分析(MySQL版)

11.1 概述

11.2 项目效果预览

11.3 项目准备

11.4 导入MySQL数据

11.4.1 Python操纵MySQL

11.4.2 Python连接MySQL数据库

11.5 项目实现过程

11.5.1 数据准备

11.5.2 数据检测

11.5.3 年度注册用户分析

11.5.4 新注册用户分析

11.6 小结

第12章 电商销售数据分析与预测

12.1 概述

12.2 项目效果预览

12.3 项目准备

12.4 分析方法

12.5 项目实现过程

12.5.1 数据处理

12.5.2 日期数据统计并显示

12.5.3 销售收入分析

12.5.4 销售收入与广告费相关性分析

12.5.5 销售收入预测

12.5.6 预测评分

12.6 小结

第13章 二手房房价分析与预测

13.1 概述

13.2 项目效果预览

13.3 项目准备

13.4 图表工具模块

13.4.1 绘制饼形图

13.4.2 绘制折线图

13.4.3 绘制条形图

13.5 项目实现过程

13.5.1 数据清洗

13.5.2 区域二手房均价分析

13.5.3 区域二手房数据及占比分析

13.5.4 全市二手房装修程度分析

13.5.5 热门户型均价分析

13.5.6 二手房房价预测

13.6 小结

第14章 客户价值分析

14.1 概述

14.2 项目效果预览

14.3 项目准备

14.4 分析方法

14.4.1 RFM模型

14.4.2 聚类

14.5 项目实现过程

14.5.1 准备工作

14.5.2 数据抽取

14.5.3 数据探索分析

14.5.4 计算RFM值

14.5.5 数据转换

14.5.6 客户聚类

14.5.7 标记客户类别

14.6 客户价值结果分析

14.7 小结

附录

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部