当当云阅读 > 科技 > 计算机/网络 > 程序设计 > Pandas入门与实战应用 :基于Python的数据分析与处理

Pandas入门与实战应用 :基于Python的数据分析与处理电子书

实用性：着眼于Pandas 实战应用，探讨深层次的技巧问题。详尽的实例：每一章都附有大量的实例，通过实例介绍知识点。*性：涵盖了Pandas 应用的所有知识，以及实战应用中的关键问题。生动性：在内容表现上，采用大量的图表，使整本书的风格生动、形象。

售价：¥

纸质售价：¥66.70购买纸书

92人正在读 | 0人评论

6.6

作者：周峰,周俊庆

出版社：电子工业出版社

出版时间：2022-08-01

字数：9.7万

所属分类：科技 > 计算机/网络 > 程序设计

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(0条)

读书简介
目录
累计评论(0条)

本书首先系统讲解Pandas快速门的基础知识，如Pandas的定义、优势、发环境配置、常用的数据结构等；然后通过实例介绍Pandas数据的导、导出、查看、清洗、合并、对比、预处理等基本操作；着讲解Pandas数据的提取、筛选、聚合函数、分组、透视、统计及可视化等操作；后讲解Pandas数据的机器学习和时间序列的知识。在本书的讲解过程中既考虑读者的学习习惯，又通过具体实例剖析Pandas实战应用中的热问题、关键问题及种种难题。本书适合对数据分析有浓厚兴趣但不知如何下手的初学者；也适合Python和Pandas爱好者；更适用于培训机构的师生、数据分析爱好者、数据分析从业人员阅读研究，是一本难得的系统学习Pandas的门书。 【推荐语】 实用性：着眼于Pandas 实战应用，探讨深层次的技巧问题。详尽的实例：每一章都附有大量的实例，通过实例介绍知识。全面性：涵盖了Pandas 应用的所有知识，以及实战应用中的关键问题。实用性：在内容表现上，采用大量的图表，使整本书的风格生动、形象。 【作者】 周峰，毕业于青岛海洋大学计算机科学与应用专业。曾先后就职于青岛商业中专和青岛远洋学院计算机系，从事计算机辅助设计的教学与研究。曾出版作品如下：《C语言实用程序设计100例》《VB控件实用程序设计100例》《计算机立体美术设计3ds max实例教程》《Flash MX 2004网络动画精彩实例创作通》

目录展开

内容简介

前言

第1章 Pandas快速入门

1.1 初识Pandas

1.1.1 什么是Pandas

1.1.2 Pandas的主要数据结构

1.1.3 Pandas的优势

1.2 Pandas开发环境配置

1.2.1 Python概述

1.2.2 Anaconda概述

1.2.3 Anaconda的下载

1.2.4 Anaconda的安装

1.2.5 Jupyter Notebook概述

1.3 Jupyter Notebook界面的基本操作

1.3.1 Jupyter Notebook的主界面

1.3.2 Jupyter Notebook的编辑页面

1.3.3 Jupyter Notebook的文件操作

1.4 实例：第一个Pandas数据处理程序

第2章 Pandas常用的数据结构

2.1 初识数据结构

2.1.1 什么是数据及数据处理

2.1.2 什么是信息

2.1.3 什么是数据结构

2.2 Python的数据结构

2.2.1 数值型应用实例

2.2.2 字符串型应用实例

2.2.3 列表应用实例

2.2.4 元组应用实例

2.2.5 字典应用实例

2.2.6 集合应用实例

2.3 NumPy的数据结构

2.3.1 NumPy数组的创建

2.3.2 NumPy特殊数组

2.3.3 NumPy序列数组

2.3.4 NumPy数组运算

2.3.5 NumPy的矩阵

2.3.6 两个数组的点积

2.3.7 两个向量的点积

2.3.8 数组的向量内积

2.3.9 矩阵的行列式

2.3.10 矩阵的逆

2.4 Pandas的数据结构

2.4.1 一维数组系列应用实例

2.4.2 二维数组应用实例

第3章 Pandas数据的导入与导出

3.1 导入CSV文件

3.1.1 CSV文件概述

3.1.2 创建CSV文件，并输入内容

3.1.3 read_csv（）方法

3.1.4 利用read_csv（）方法导入CSV文件实例

3.2 导入Excel文件

3.2.1 在Excel中输入内容并上传

3.2.2 read_excel（）方法

3.2.3 利用read_excel（）方法导入Excel文件实例

3.3 导入JSON文件

3.3.1 创建JSON文件，并输入内容

3.3.2 read_json（）方法

3.3.3 利用read_json（）方法导入JSON文件实例

3.4 Pandas数据的输出

3.4.1 输出CSV文件

3.4.2 输出Excel文件

3.4.3 输出JSON文件

第4章 Pandas数据表的查看和清洗

4.1 Pandas数据表信息的查看

4.1.1 利用shape属性查看数据表的维度

4.1.2 利用dtype和dtypes属性查看列数据的类型

4.1.3 利用columns和values属性查看数据表的表头和数据信息

4.1.4 利用isnull（）方法查看空值信息

4.1.5 利用unique（）方法查看列中的无重复数据信息

4.1.6 利用info（）方法查看数据表的基本信息

4.1.7 利用head（）方法查看数据表前几行数据

4.1.8 利用tail（）方法查看数据表后几行数据

4.2 Pandas数据表的清洗

4.2.1 空值的清洗

4.2.2 格式错误数据的清洗

4.2.3 错误数据的清洗

4.2.4 重复数据的清洗

4.2.5 数据表列名的清洗

4.2.6 数据内容的清洗

第5章 Pandas数据的合并与对比

5.1 利用append（）方法追加数据

5.1.1 append（）方法及参数

5.1.2 利用append（）方法实现相同结构数据表的数据追加

5.1.3 利用append（）方法实现不同结构数据表的数据追加

5.1.4 利用append（）方法实现忽略索引的数据追加

5.1.5 追加Series序列

5.1.6 追加字典列表

5.2 利用concat（）方法合并数据

5.2.1 concat（）方法及参数

5.2.2 利用concat（）方法纵向合并数据

5.2.3 利用concat（）方法横向合并数据

5.2.4 合并数据的交集

5.3 利用merge（）方法合并数据

5.3.1 merge（）方法及参数

5.3.2 利用merge（）方法合并数据实例

5.4 利用compare（）方法对比数据

5.4.1 compare（）方法及参数

5.4.2 利用compare（）方法对比数据实例

第6章 Pandas数据的预处理

6.1 设置索引列

6.1.1 Pandas索引的作用

6.1.2 set_index（）方法及参数

6.1.3 利用set_index（）方法设置索引列实例

6.1.4 利用reset_index（）方法还原索引列实例

6.2 排序

6.2.1 按索引列排序

6.2.2 按指定列排序

6.3 分组标记

6.3.1 利用where（）方法添加分组标记

6.3.2 根据多个条件进行分组标记

6.4 列的拆分

第7章 Pandas数据的提取

7.1 利用loc[]提取数据

7.1.1 利用loc[]提取整行数据

7.1.2 利用loc[]提取整列数据

7.1.3 利用loc[]提取具体数据

7.2 利用iloc[]提取数据

7.2.1 利用iloc[]提取整行数据

7.2.2 利用iloc[]提取整列数据

7.2.3 利用iloc[]提取具体数据

7.3 利用属性提取数据

7.4 利用for循环提取数据

第8章 Pandas数据的筛选

8.1 Pandas数据关系筛选

8.1.1 等于关系数据筛选实例

8.1.2 不等于关系数据筛选实例

8.1.3 大于和大于等于关系数据筛选实例

8.1.4 小于和小于等于关系数据筛选实例

8.2 Pandas数据逻辑筛选

8.2.1 使用“与”进行数据筛选实例

8.2.2 使用“或”进行数据筛选实例

8.2.3 使用“非”进行数据筛选实例

8.3 使用query（）方法进行数据筛选实例

8.4 使用filter（）方法进行数据筛选

8.4.1 filter（）方法及意义

8.4.2 使用filter（）方法进行数据筛选实例

第9章 Pandas数据的聚合函数

9.1 sum（）函数的应用

9.1.1 sum（）函数及参数

9.1.2 sum（）函数应用实例

9.2 mean（）函数的应用

9.2.1 mean（）函数及参数

9.2.2 mean（）函数应用实例

9.3 max（）函数的应用

9.3.1 max（）函数及参数

9.3.2 max（）函数应用实例

9.4 min（）函数的应用

9.4.1 min（）函数及参数

9.4.2 min（）函数应用实例

9.5 count（）函数的应用

9.5.1 count（）函数及参数

9.5.2 count（）函数应用实例

第10章 Pandas数据的分组与透视

10.1 Pandas数据的分组

10.1.1 groupby（）方法及参数

10.1.2 groupby（）方法的应用

10.1.3 agg（）方法的应用

10.1.4 transform（）方法的应用

10.2 Pandas数据的透视

10.2.1 pivot_table（）方法及参数

10.2.2 利用pivot_table（）方法透视数据实例

10.2.3 crosstab（）方法及参数

10.2.4 利用crosstab（）方法透视数据实例

第11章 Pandas数据的统计

11.1 数据采样

11.1.1 sample（）方法及参数

11.1.2 利用sample（）方法进行数据采样实例

11.2 数据统计

11.2.1 数据表描述性统计

11.2.2 利用describe（）方法进行数据表描述性统计实例

11.2.3 中位数的应用

11.2.4 方差的应用

11.2.5 标准差的应用

11.3 数据相关性分析

11.3.1 协方差的应用

11.3.2 协方差相关系数的应用

第12章 Pandas数据的可视化

12.1 利用Pandas中的plot（）方法绘图

12.1.1 plot（）方法及参数

12.1.2 绘制折线图实例

12.1.3 绘制条形图实例

12.1.4 利用plot（）方法绘制其他类型图形实例

12.2 利用Matplotlib包绘制Pandas数据图形

12.2.1 figure（）方法的应用实例

12.2.2 plot（）方法的应用实例

12.2.3 subplot（）方法的应用实例

12.2.4 add_axes（）方法的应用实例

12.2.5 legend（）方法的应用实例

12.2.6 设置线条的宽度和颜色实例

12.2.7 添加坐标轴网格线实例

第13章 Pandas数据的机器学习算法

13.1 机器学习概述

13.1.1 什么是机器学习

13.1.2 机器学习的类型

13.2 常见的机器学习算法

13.3 机器学习的sklearn包

13.3.1 sklearn包中的数据集

13.3.2 iris数据集

13.3.3 查看iris数据集实例

13.4 决策树

13.4.1 决策树的组成

13.4.2 决策树的优点

13.4.3 决策树的缺点

13.4.4 决策树实现实例

13.5 随机森林

13.5.1 随机森林的构建

13.5.2 随机森林的优缺点

13.5.3 随机森林的应用范围

13.5.4 随机森林实现实例

13.6 支持向量机

13.6.1 支持向量机的工作原理

13.6.2 核函数

13.6.3 支持向量机的优点

13.6.4 支持向量机的缺点

13.6.5 支持向量机实现实例

13.7 朴素贝叶斯算法

13.7.1 朴素贝叶斯算法的思想

13.7.2 朴素贝叶斯算法的步骤

13.7.3 朴素贝叶斯算法的优缺点

13.7.4 高斯朴素贝叶斯模型实现实例

13.7.5 多项式分布朴素贝叶斯模型实现实例

13.7.6 伯努力朴素贝叶斯模型实现实例

第14章 Pandas的时间序列数据

14.1 Pandas时间序列的创建

14.1.1 date_range（）方法及参数

14.1.2 利用date_range（）方法创建时间序列实例

14.1.3 时间戳对象

14.2 时间类型与字符串型的转换

14.3 时间序列数据的操作技巧

14.3.1 时间序列数据的提取

14.3.2 时间序列数据的筛选

14.3.3 时间序列数据的重采样

14.3.4 时间序列数据的滑动窗口

14.4 时间序列数据的预测

14.4.1 时间序列数据的准备

14.4.2 时间序列数据的朴素预测法

14.4.3 时间序列数据的简单平均预测法

14.4.4 时间序列数据的移动平均预测法

14.4.5 时间序列数据的简单指数平滑预测法

14.4.6 时间序列数据的霍尔特线性趋势预测法

14.4.7 时间序列数据的Holt-Winters季节性预测法

14.4.8 时间序列数据的自回归移动平均预测法

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

发表评论

买过这本书的人还买过

读了这本书的人还在读

支持设备

Python网络爬虫:从入门到精通(附微课) ￥31.90

吕云翔主编

￥31.90

算法详解(卷3)——贪心算法和动态规划￥44.67

蒂姆·拉夫加登(Tim Roughgarden) 著

￥44.67

Python数据科学实战￥44.67

尤利•瓦西列夫(Yuli Vasiliev) 著

￥44.67

面向对象是怎样工作的(第3版) ￥34.90

[日]平泽章著

￥34.90

Python办公效率手册￥38.27

麦叔著

￥38.27

Python 3.8从零开始学￥27.93

刘艳,刘宇宙

￥27.93

Python数据分析基础与案例实战￥38.80

杨果仁张良均主编

￥38.80

算法详解(卷4)——NP-Hard问题算法￥51.07

蒂姆·拉夫加登(Tim Roughgarden) 著

￥51.07

Python网络爬虫技术(第2版)(微课版) ￥32.00

池瑞楠,张良均主编

￥32.00

程序是怎样跑起来的(第3版) ￥29.90

[日]矢泽久雄著

￥29.90

更多同类图书 >

Pandas入门与实战应用 :基于Python的数据分析与处理电子书

支持设备

Python网络爬虫:从入门到精通(附微课) ￥31.90

算法详解(卷3)——贪心算法和动态规划 ￥44.67

Python数据科学实战 ￥44.67

面向对象是怎样工作的(第3版) ￥34.90

Python办公效率手册 ￥38.27

Python 3.8从零开始学 ￥27.93

Python数据分析基础与案例实战 ￥38.80

算法详解(卷4)——NP-Hard问题算法 ￥51.07