万本电子书0元读

万本电子书0元读

顶部广告

数据科学入门(第2版)电子书

1.全能数据科学家成长指南,长居美亚机器学习热销榜; 2.新版基于Python 3.6,新引了类型注释等许多功能; 3.根据数据科学近几年的发展,新增了关于深度学习、统计学和自然语言处理等主题,让图书内容与时俱。 - 学到一堂Python速成课。 - 学习线性代数、统计学和概率论的基础知识,并能将其灵活地用于数据科学项目。 - 掌握如何获取、探索、清洗、处理和调整数据。

售       价:¥

纸质售价:¥54.50购买纸书

165人正在读 | 1人评论 6.2

作       者:[美]乔尔·格鲁斯(Joel Grus)

出  版  社:人民邮电出版社有限公司

出版时间:2021-01-01

字       数:29.6万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(2条)
  • 读书简介
  • 目录
  • 累计评论(2条)
本书基于Python语言环境,从零始讲解数据科学工作,讲述数据科学工作所需的技能与诀窍,并带领读者熟悉数据科学的核心知识:数学与统计学。作者借助大量具有现实意义的实例详细展示了什么是数据科学,介绍了从事数据科学工作需要用到的库,如NumPy、scikit-learn、pandas等,还在每章末尾推荐了很多学习资源,帮助你一步巩固本书所学。新版基于Python 3.6,重写了所有示例和代码,并根据数据科学近几年的发展,新增了关于深度学习、统计学和自然语言处理等主题,让图书内容与时俱。<br/>【推荐语】<br/>1.全能数据科学家成长指南,长居美亚机器学习热销榜; 2.新版基于Python 3.6,新引了类型注释等许多功能; 3.根据数据科学近几年的发展,新增了关于深度学习、统计学和自然语言处理等主题,让图书内容与时俱。 - 学到一堂Python速成课。 - 学习线性代数、统计学和概率论的基础知识,并能将其灵活地用于数据科学项目。 - 掌握如何获取、探索、清洗、处理和调整数据。 - 深理解机器学习概念,尤其是深度学习概念。 - 运用k*近邻法、朴素贝叶斯、线性回归、逻辑回归、决策树、神经网络和聚类等算法实现数据模型。 - 探索自然语言处理、网络分析、推荐系统、数据库与SQL、MapReduce。 无论你身处哪个行业,数据都能成为你的好帮手。善于从凌乱的数据中提取有用的信息,你就能在面对业务难题时游刃有余,用数据说话,为决策找到有力的支撑。 欢迎数据科学世界!在本书中,你将化身为虚构公司DataSciencester的员工,从零始数据科学工作,亲手构建工具、实现算法,*终从数据科学新手蜕变为全能的数据科学家。在第1版的基础上,本书升级了所有代码示例,并新增了深度学习、统计学、自然语言处理等相关内容。<br/>【作者】<br/>乔尔·格鲁斯(Joel Grus) Capital Group公司的首席机器学习工程师,担任过艾伦研究所的人工智能研发工程师以及谷歌公司的软件工程师,还曾在多家创业公司担任数据科学家。   【译者简介】 岳冰 美国西北大学数学硕士,知乎专栏“X-Lab”编辑,参与编撰了《知识图谱标准化白皮书(2019版)》。深耕图神经网络、推荐算法、复杂关系网络风险挖掘、机器学习等领域。运用人工智能算法与工具,长期支持有关部门用高精尖技术手段违法犯罪。   高蓉 讲师,任教于杭州电子科技大学经济学院金融系。博士和硕士毕业于南大学经济学院金融系,本科毕业于南大学数学学院计算数学专业。研究领域包括数据科学应用、资产定价、金融工程、计量经济应用等。   韩波 自由译者、撰稿人,从事信息技术工作二十余年,主要兴趣领域为机器学习、Python等。曾为多家信息技术媒体撰稿,另译有《Python数据分析》。<br/>
目录展开

版权声明

O'Reilly Media, Inc. 介绍

业界评论

第2版前言

排版约定

使用示例代码

O'Reilly在线学习平台(O'Reilly Online Learning)

联系我们

致谢

更多信息

第1版前言

数据科学

从零开始

第 1 章 导论

1.1 数据的崛起

1.2 什么是数据科学

1.3 激励假设:DataSciencester

1.3.1 寻找关键联系人

1.3.2 你可能知道的数据科学家

1.3.3 工资和工作年限

1.3.4 付费账户

1.3.5 感兴趣的主题

1.3.6 展望

第 2 章 Python速成

2.1 Python之禅

2.2 获取Python

2.3 虚拟环境

2.4 空白格式

2.5 模块

2.6 函数

2.7 字符串

2.8 异常

2.9 列表

2.10 元组

2.11 字典

defaultdict

2.12 计数器

2.13 集

2.14 控制流

2.15 真和假

2.16 排序

2.17 列表解析

2.18 自动化测试和断言

2.19 面向对象编程

2.20 迭代器和生成器

2.21 随机性

2.22 正则表达式

2.23 函数式编程

2.24 压缩和参数拆分

2.25 args和kwargs

2.26 类型注释

如何编写类型注释

2.27 欢迎来到DataSciencester

2.28 进一步探索

第 3 章 数据可视化

3.1 matplotlib

3.2 条形图

3.3 线图

3.4 散点图

3.5 延伸学习

第 4 章 线性代数

4.1 向量

4.2 矩阵

4.3 延伸学习

第 5 章 统计学

5.1 描述单个数据集

5.1.1 中心倾向

5.1.2 离散度

5.2 相关

5.3 辛普森悖论

5.4 相关系数的其他注意事项

5.5 相关与因果

5.6 延伸学习

第 6 章 概率

6.1 依赖和独立

6.2 条件概率

6.3 贝叶斯定理

6.4 随机变量

6.5 连续分布

6.6 正态分布

6.7 中心极限定理

6.8 延伸学习

第 7 章 假设和推论

7.1 统计假设检验

7.2 实例:掷硬币

7.3 值

7.4 置信区间

7.5 p-Hacking

7.6 实例:运行A/B测试

7.7 贝叶斯推断

7.8 延伸学习

第 8 章 梯度下降

8.1 梯度下降的思想

8.2 估算梯度

8.3 使用梯度

8.4 选择正确步长

8.5 使用梯度下降拟合模型

8.6 小批次梯度下降和随机梯度下降

8.7 延伸学习

第 9 章 获取数据

9.1 stdin和stdout

9.2 读取文件

9.2.1 文本文件的基础

9.2.2 限制的文件

9.3 网络抓取

HTML和解析方法

9.4 使用API

9.4.1 JSON和XML

9.4.2 使用无验证的API

9.4.3 寻找API

9.5 实例:使用Twitter API

获取证明文件

9.6 延伸学习

第 10 章 数据工作

10.1 探索数据

10.1.1 探索一维数据

10.1.2 两个维度

10.1.3 多维数据

10.2 使用NamedTuple

10.3 数据类

10.4 清洗和修改

10.5 数据处理

10.6 数据调整

10.7 题外话:tqdm

10.8 降维

10.9 延伸学习

第 11 章 机器学习

11.1 建模

11.2 什么是机器学习

11.3 过拟合与欠拟合

11.4 正确性

11.5 偏差-方差权衡

11.6 特征提取与选择

11.7 延伸学习

第 12 章 k 最近邻法

12.1 模型

12.2 实例:鸢尾花数据集

12.3 维数灾难

12.4 进一步探索

第 13 章 朴素贝叶斯算法

13.1 一个简易的垃圾邮件过滤器

13.2 一个复杂的垃圾邮件过滤器

13.3 算法实现

13.4 测试模型

13.5 使用模型

13.6 延伸学习

第 14 章 简单线性回归

14.1 模型

14.2 使用梯度下降法

14.3 最大似然估计

14.4 延伸学习

第 15 章 多元回归

15.1 模型

15.2 最小二乘模型的进一步假设

15.3 拟合模型

15.4 解释模型

15.5 拟合优度

15.6 题外话:Bootstrap

15.7 回归系数的标准误差

15.8 正则化

15.9 延伸学习

第 16 章 逻辑回归

16.1 问题

16.2 logistic函数

16.3 应用模型

16.4 拟合优度

16.5 支持向量机

16.6 延伸学习

第 17 章 决策树

17.1 什么是决策树

17.2 熵

17.3 分割的熵

17.4 创建决策树

17.5 综合运用

17.6 随机森林

17.7 延伸学习

第 18 章 神经网络

18.1 感知器

18.2 前馈神经网络

18.3 反向传播

18.4 实例:Fizz Buzz

18.5 延伸学习

第 19 章 深度学习

19.1 张量

19.2 层抽象

19.3 线性层

19.4 把神经网络作为层序列

19.5 损失函数与优化器

19.6 实例:重新设计异或网络

19.7 其他激活函数

19.8 实例:重新解决Fizz Buzz问题

19.9 softmax函数和交叉熵

19.10 丢弃

19.11 实例:MNIST

19.12 保存和加载模型

19.13 延伸学习

第 20 章 聚类分析

20.1 原理

20.2 模型

20.3 实例:聚会

20.4 选择聚类数目 k

20.5 实例:色彩聚类

20.6 自下而上的分层聚类

20.7 延伸学习

第 21 章 自然语言处理

21.1 词云

21.2 n-gram语言模型

21.3 语法

21.4 题外话:吉布斯采样

21.5 主题建模

21.6 词向量

21.7 递归神经网络

21.8 实例:使用字符级RNN

21.9 延伸学习

第 22 章 网络分析

22.1 中介中心性

22.2 特征向量中心性

22.2.1 矩阵乘法

22.2.2 中心性

22.3 有向图与PageRank

22.4 延伸学习

第 23 章 推荐系统

23.1 人工管理

23.2 推荐流行事务

23.3 基于用户的协同过滤

23.4 基于项目的协同过滤

23.5 矩阵分解

23.6 延伸学习

第 24 章 数据库与 SQL

24.1 CREATE TABLE与INSERT

24.2 UPDATE

24.3 DELETE

24.4 SELECT

24.5 GROUP BY

24.6 ORDER BY

24.7 JOIN

24.8 子查询

24.9 索引

24.10 查询优化

24.11 NoSQL

24.12 延伸学习

第 25 章 MapReduce

25.1 实例:单词计数

25.2 为什么是MapReduce

25.3 更一般化的MapReduce

25.4 实例:状态分析更新

25.5 实例:矩阵乘法

25.6 题外话:组合器

25.7 延伸学习

第 26 章 数据伦理

26.1 什么是数据伦理

26.2 讲真的,什么是数据伦理

26.3 是否应该关注数据伦理

26.4 建立不良数据产品

26.5 精确与公平之间的较量

26.6 合作

26.7 可解释性

26.8 推荐

26.9 异常数据

26.10 数据保护

26.11 小结

26.12 延伸学习

第 27 章 数据科学前瞻

27.1 IPython

27.2 数学

27.3 不从零开始

27.3.1 NumPy

27.3.2 pandas

27.3.3 scikit-learn

27.3.4 可视化

27.3.5 R

27.3.6 深度学习

27.4 寻找数据

27.5 从事数据科学工作

27.5.1 Hacker News

27.5.2 消防车

27.5.3 T恤

27.5.4 地球仪上的推文

27.5.5 你的发现

关于作者

关于封面

看完了

累计评论(2条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部