万本电子书0元读

万本电子书0元读

顶部广告

Python数据科学实践指南电子书

售       价:¥

纸质售价:¥44.20购买纸书

5人正在读 | 0人评论 6.5

作       者:纪路

出  版  社:机械工业出版社

出版时间:2017-04-01

字       数:17.4万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(3条)
  • 读书简介
  • 目录
  • 累计评论(3条)
本书分为三大部分,其中第1~4章是Python基础,这个部分会介绍阅读本书所必须掌握的Python知识。第5~7章是讲解Python直提供的数据处理工具,这些工具包括一些易用的数据结构、标准库和第三方工具。第8~12章是一些实际的案例,将会涉及Python主要擅长的几个领域。后的三个附录分别介绍了关于Python的一些扩展知识。<br/>
目录展开

前言

第0章 发现、出发

0.1 何谓数据科学

0.1.1 海量的数据与科学的方法

0.1.2 数据科学并不是新概念

0.1.3 数据科学是一个系统工程

0.2 如何成为数据科学家

0.3 为什么是Python

0.4 一个简单的例子

第1章 Python介绍

1.1 Python的版本之争

1.2 Python解释器

1.2.1 Mac OS X系统

1.2.2 Linux系统

1.2.3 Windows系统

1.3 第一段Python程序

1.4 使用Python shell调试程序

第2章 Python基础知识

2.1 应当掌握的基础知识

2.1.1 基础数据类型

2.1.2 变量和赋值

2.1.3 操作符及表达式

2.1.4 文本编辑器

2.2 字符串

2.3 获取键盘输入

2.4 流程控制

2.4.1 条件判断

2.4.2 循环

2.4.3 缩进、空白和注释

第3章 函数及异常处理

3.1 函数和函数的参数

3.1.1 定义函数

3.1.2 关键字参数和默认参数

3.1.3 可变数量的参数

3.1.4 递归

3.2 闭包

3.3 异常和断言

第4章 高级字符串处理

4.1 字符集和字符编码

4.1.1 ASCII字符集和编码

4.1.2 Unicode字符集及UTF-8编码

4.2 字符串操作和格式化

4.2.1 字符串的基本操作

4.2.2 字符串分割

4.2.3 字符串格式化

4.3 正则表达式

4.3.1 正则表达式入门

4.3.2 在Python中使用正则表达式

第5章 容器和collections

5.1 元组

5.2 列表

5.2.1 引用传递

5.2.2 列表解析式

5.3 字典

5.4 collections

5.4.1 namedtuple

5.4.2 Counter

5.4.3 defaultdict

5.4.4 OrderedDict

第6章 Python标准库简介

6.1 math模块

6.1.1 常见常量

6.1.2 无穷

6.1.3 整数转换

6.1.4 绝对值和符号

6.1.5 常用计算

6.1.6 指数和对数

6.2 time

6.3 random

6.3.1 随机数生成器

6.3.2 取样

6.4 glob和fileinput

6.5 bz2和gzip

6.6 pprint

6.7 traceback

6.8 JSON

第7章 用Python读写外部数据

7.1 CSV文件的读写

7.1.1 读取CSV文件

7.1.2 创建CSV文件

7.1.3 处理方言

7.1.4 将读取的结果转换成字典

7.2 Excel文件的读写

7.2.1 读取Excel文件

7.2.2 写Excel文件

7.3 MySQL的读写

7.3.1 写入MySQL

7.3.2 读取MySQL

第8章 统计编程

8.1 描述性统计

8.1.1 人口普查数据

8.1.2 均值和中位数

8.1.3 方差和标准差

8.1.4 分布

8.2 数据可视化入门

8.2.1 pyplot基础

8.2.2 柱状图和饼图

8.3 概率

第9章 爬虫入门

9.1 网络资源及爬虫的基本原理

9.2 使用request模块获取HTML内容

9.2.1 关于HTTP协议

9.2.2 使用requests的get方法获取HTML内容

9.3 使用Xpath解析HTML中的内容

9.3.1 HTML的层级和Xpath的基本概念

9.3.2 使用谷歌浏览器快速创建Xpath路径

9.3.3 使用谷歌浏览器复制需要JS渲染的HTML页面

9.4 实战:爬取京东商品品类及品牌列表

第10章 数据科学的第三方库介绍

10.1 Numpy入门和实战

10.1.1 Numpy基础

10.1.2 Numpy基本运算

10.1.3 Numpy高级特性

10.1.4 kNN实战

10.2 Pandas的入门和实战

10.2.1 Pandas基础

10.2.2 泰坦尼克号生存率分析实战

10.3 Scikit-learn入门和实战

10.3.1 机器学习术语

10.3.2 Scikit-learn基础

10.3.2 实战

第11章 利用Python进行图数据分析

11.1 图基础

11.2 NetworkX入门

11.2.1 基本操作

11.2.2 为图中的元素添加属性

11.2.3 有向图及节点的度数

11.2.4 构建图及图的操作

11.3 使用NetworkX进行图分析

11.3.1 利用联通子图发现社区

11.3.2 通过三角计算强化社区发现

11.3.3 利用PageRank发现影响力中心

第12章 大数据工具入门

12.1 Hadoop

12.1.1 Hadoop的计算原理

12.1.2 在Hadoop上运行Python程序

12.2 Spark

12.2.1 为什么需要Spark

12.2.2 如何学习Spark

12.3 大数据与数据科学的区别

附录A 编写Python 2与Python 3兼容的代码

附录B 安装完整的Python开发环境

附录C 常用的Python技巧

累计评论(3条) 5个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部