数据科学入门电子书

介绍数据科学基本知识的重量级读本，Google数据科学家作品。数据科学是一个蓬勃发展、前途无限的行业，有人将数据科学家称为“21世纪头号性感职业”。本书从零始讲解数据科学工作，教授数据科学工作所必需的黑客技能，并带领读者熟悉数据科学的核心知识——数学和统计学。作者选择了功能强大、简单易学的Python语言环境，亲手搭建工具和实现算法，并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。通过阅读本书，你可以：学到一堂Python速成课；学习线性代数、统计和概率论的基本方法，了解它们是怎样应用在数据科学中的；掌握如何收集、探索、清理、转换和操作数据；深理解机器学习的基础；运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型；探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。

售价：¥

纸质售价：¥51.70购买纸书

272人正在读 | 1人评论

6.2

作者：格鲁斯（Joel Grus）

出版社：人民邮电出版社

出版时间：2016-03-01

字数：23.9万

所属分类：科技 > 计算机/网络 > 计算机理论与教程

温馨提示：数字商品不支持退换货，不提供源文件，不支持导出打印

为你推荐

读书简介
目录
累计评论(2条)

读书简介
目录
累计评论(2条)

本书基于易于理解且具有数据科学相关的丰富的库的Python语言环境，从零始讲解数据科学工作。具体内容包括：Python速成，可视化数据，线性代数，统计，概率，假设与推断，梯度下降法，如何获取数据，k近邻法，朴素贝叶斯算法，等等。作者借助大量具体例子以及数据挖掘、统计学、机器学习等领域的重要概念，详细展示了什么是数据科学。 【推荐语】 介绍数据科学基本知识的重量级读本，Google数据科学家作品。数据科学是一个蓬勃发展、前途无限的行业，有人将数据科学家称为“21世纪头号性感职业”。本书从零始讲解数据科学工作，教授数据科学工作所必需的黑客技能，并带领读者熟悉数据科学的核心知识——数学和统计学。作者选择了功能强大、简单易学的Python语言环境，亲手搭建工具和实现算法，并精心挑选了注释良好、简洁易读的实现范例。书中涵盖的所有代码和数据都可以在GitHub上下载。通过阅读本书，你可以：学到一堂Python速成课；学习线性代数、统计和概率论的基本方法，了解它们是怎样应用在数据科学中的；掌握如何收集、探索、清理、转换和操作数据；深理解机器学习的基础；运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型；探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。 【作者】 Joel Grus是Google的一位软件工程师，曾于数家创业公司担任数据科学家。目前住在西雅图，专注于数据科学工作并乐此不疲。偶尔在joelgrus.com发表博客，长期活跃于Twitter @joelgrus。

目录展开

O'Reilly Media, Inc. 介绍

业界评论

前言

从零开始

本书排版约定

示例代码的使用

致谢

第1章导论

1.1 数据的威力

1.2 什么是数据科学

1.3 激励假设：DataSciencester

1.4 展望

第2章 Python 速成

2.1 基础内容

2.2 进阶内容

2.3 延伸学习

第3章可视化数据

3.1 matplotlib

3.2 条形图

3.3 线图

3.4 散点图

3.5 延伸学习

第4章线性代数

4.1 向量

4.2 矩阵

4.3 延伸学习

第5章统计学

5.1 描述单个数据集

5.2 相关

5.3 辛普森悖论

5.4 相关系数其他注意事项

5.5 相关和因果

5.6 延伸学习

第6章概率

6.1 不独立和独立

6.2 条件概率

6.3 贝叶斯定理

6.4 随机变量

6.5 连续分布

6.6 正态分布

6.7 中心极限定理

6.8 延伸学习

第7章假设与推断

7.1 统计假设检验

7.2 案例：掷硬币

7.3 置信区间

7.4 P-hacking

7.5 案例：运行A/B测试

7.6 贝叶斯推断

7.7 延伸学习

第8章梯度下降

8.1 梯度下降的思想

8.2 估算梯度

8.3 使用梯度

8.4 选择正确步长

8.5 综合

8.6 随机梯度下降法

8.7 延伸学习

第9章获取数据

9.1 stdin和stdout

9.2 读取文件

9.3 网络抓取

9.4 使用API

9.5 案例：使用Twitter API

9.6 延伸学习

第10章数据工作

10.1 探索你的数据

10.2 清理与修改

10.3 数据处理

10.4 数据调整

10.5 降维

10.6 延伸学习

第11章机器学习

11.1 建模

11.2 什么是机器学习

11.3 过拟合和欠拟合

11.4 正确性

11.5 偏倚-方差权衡

11.6 特征提取和选择

11.7 延伸学习

第12章 k 近邻法

12.1 模型

12.2 案例：最喜欢的编程语言

12.3 维数灾难

12.4 延伸学习

第13章朴素贝叶斯算法

13.1 一个简易的垃圾邮件过滤器

13.2 一个复杂的垃圾邮件过滤器

13.3 算法的实现

13.4 测试模型

13.5 延伸学习

第14章简单线性回归

14.1 模型

14.2 利用梯度下降法

14.3 最大似然估计

14.4 延伸学习

第15章多重回归分析

15.1 模型

15.2 最小二乘模型的进一步假设

15.3 拟合模型

15.4 解释模型

15.5 拟合优度

15.6 题外话：Bootstrap

15.7 回归系数的标准误差

15.8 正则化

15.9 延伸学习

第16章逻辑回归

16.1 问题

16.2 Logistic函数

16.3 应用模型

16.4 拟合优度

16.5 支持向量机

16.6 延伸学习

第17章决策树

17.1 什么是决策树

17.2 熵

17.3 分割之熵

17.4 创建决策树

17.5 综合运用

17.6 随机森林

17.7 延伸学习

第18章神经网络

18.1 感知器

18.2 前馈神经网络

18.3 反向传播

18.4 实例：战胜CAPTCHA

18.5 延伸学习

第19章聚类分析

19.1 原理

19.2 模型

19.3 示例：聚会

19.4 选择聚类数目k

19.5 示例：对色彩进行聚类

19.6 自下而上的分层聚类

19.7 延伸学习

第20章自然语言处理

20.1 词云

20.2 n-grams模型

20.3 语法

20.4 题外话：吉布斯采样

20.5 主题建模

20.6 延伸学习

第21章网络分析

21.1 中介中心度

21.2 特征向量中心度

21.3 有向图与PageRank

21.4 延伸学习

第22章推荐系统

22.1 手工甄筛

22.2 推荐流行事物

22.3 基于用户的协同过滤方法

22.4 基于物品的协同过滤算法

22.5 延伸学习

第23章数据库与 SQL

23.1 CREATE TABLE与INSERT

23.2 UPDATE

23.3 DELETE

23.4 SELECT

23.5 GROUP BY

23.6 ORDER BY

237 JOIN

23.8 子查询

23.9 索引

23.10 查询优化

23.11 NoSQL

23.12 延伸学习

第24章 MapReduce

24.1 案例：单词计数

24.2 为什么是MapReduce

24.3 更加一般化的MapReduce

24.4 案例：分析状态更新

24.5 案例：矩阵计算

24.6 题外话：组合器

24.7 延伸学习

第25章数据科学前瞻

25.1 IPython

25.2 数学

25.3 不从零开始

25.4 寻找数据

25.5 从事数据科学

作者简介

关于封面

看完了

累计评论(2条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论，分享你的想法吧！

发表评论

买过这本书的人还买过

读了这本书的人还在读

DeepSeek硬核技术解读￥59.00

刘丹;尹俊希;杨院伶

￥59.00

OpenClaw实战指南:零基础打造会干活的AI数字员工￥79.00

徐尧

￥79.00

豆包*学习:AI 辅助中小学生学习的方法与技巧￥47.00

薛碧芸;郭泽德

￥47.00

精通Excel数据统计与分析￥57.54

李宗璋著

￥57.54

更多同类图书 >

数据科学入门电子书

支持设备

豆包使用秘笈:从入门到精通的100个实用技巧￥53.00

豆包从入门到精通:AI助手和智能体轻松搞定工作、学习和生活难题￥47.00

千问从入门到精通:AI助手和智能体轻松搞定工作、学习和生活难题￥35.00

学会提问,驾驭AI:提示词从入门到精通￥61.60

腾讯元宝使用秘笈:从入门到精通的100个实用技巧￥53.00