万本电子书0元读

万本电子书0元读

顶部广告

Python数据科学手册电子书

Python语言拥有大量可用于存储、操作和洞察数据的程序库,已然成为深受数据科学研究人员推崇的工具。本书以IPython、NumPy、Pandas、Matplotlib和Scikit-Learn这5个能完成数据科学大部分工作的基础工具为主,从实战角度出发,讲授如何清洗和可视化数据、如何用数据建立各种统计学或机器学习模型等常见数据科学任务,旨在让各领域与数据处理相关的工作人员具备发现问题、解决问题的能力。

售       价:¥

纸质售价:¥79.40购买纸书

171人正在读 | 1人评论 6.7

作       者:[美]杰克·万托布拉斯(Jake VanderPlas)

出  版  社:人民邮电出版社有限公司

出版时间:2018-02-01

字       数:37.5万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
《Python数据科学手册》是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重工具包。首先从IPython和Jupyter始,它们提供了数据科学家需要的计算环境;第 2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为重要的机器学习算法提供了高效整洁的Python版实现。 《Python数据科学手册》适合有编程背景,并算将源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。<br/>【推荐语】<br/>Python语言拥有大量可用于存储、操作和洞察数据的程序库,已然成为深受数据科学研究人员推崇的工具。本书以IPython、NumPy、Pandas、Matplotlib和Scikit-Learn这5个能完成数据科学大部分工作的基础工具为主,从实战角度出发,讲授如何清洗和可视化数据、如何用数据建立各种统计学或机器学习模型等常见数据科学任务,旨在让各领域与数据处理相关的工作人员具备发现问题、解决问题的能力。 ·IPython和Jupyter:为使用Python提供计算环境 ·NumPy:用ndarray实现高维数组的高效存储与操作 ·Pandas:用DataFrame实现带标签/列式数据的高效存储与操作 ·Matplotlib:实现各种数据可视化 ·Scikit-Learn:用高效整洁的Python实现重要的机器学习算法<br/>【作者】<br/>Jake VanderPlas是Python科学栈的深度用户和发人员,目前是华盛顿大学eScience学院物理科学研究院院长,研究方向为天文学。同时,他还为很多领域的科学家提供建议和咨询。<br/>
目录展开

译者序

前言

第1章 IPython:超越Python

1.1 shell还是Notebook

1.2 IPython的帮助和文档

1.3 IPython shell中的快捷键

1.4 IPython魔法命令

1.5 输入和输出历史

1.6 IPython和shell命令

1.7 与shell相关的魔法命令

1.8 错误和调试

1.9 代码的分析和计时

1.10 IPython参考资料

第2章 NumPy入门

2.1 理解Python中的数据类型

2.2 NumPy数组基础

2.3 NumPy数组的计算:通用函数

2.4 聚合:最小值、最大值和其他值

2.5 数组的计算:广播

2.6 比较、掩码和布尔逻辑

2.7 花哨的索引

2.8 数组的排序

2.9 结构化数据:NumPy的结构化数组

第3章 Pandas数据处理

3.1 安装并使用Pandas

3.2 Pandas对象简介

3.3 数据取值与选择

3.4 Pandas数值运算方法

3.5 处理缺失值

3.6 层级索引

3.7 合并数据集:Concat与Append操作

3.8 合并数据集:合并与连接

3.9 累计与分组

3.10 数据透视表

3.11 向量化字符串操作

3.12 处理时间序列

3.13 高性能Pandas:eval()与query()

3.14 参考资料

第4章 Matplotlib数据可视化

4.1 Matplotlib常用技巧

4.2 两种画图接口

4.3 简易线形图

4.4 简易散点图

4.5 可视化异常处理

4.6 密度图与等高线图

4.7 频次直方图、数据区间划分和分布密度

4.8 配置图例

4.9 配置颜色条

4.10 多子图

4.11 文字与注释

4.12 自定义坐标轴刻度

4.13 Matplotlib自定义:配置文件与样式表

4.14 用Matplotlib画三维图

4.15 用Basemap可视化地理数据

4.16 用Seaborn做数据可视化

4.17 参考资料

第5章 机器学习

5.1 什么是机器学习

5.2 Scikit-Learn简介

5.3 超参数与模型验证

5.4 特征工程

5.5 专题:朴素贝叶斯分类

5.6 专题:线性回归

5.7 专题:支持向量机

5.8 专题:决策树与随机森林

5.9 专题:主成分分析

5.10 专题:流形学习

5.11 专题:k-means聚类

5.12 专题:高斯混合模型

5.13 专题:核密度估计

5.14 应用:人脸识别管道

5.15 机器学习参考资料

累计评论(1条) 4个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部