1.全能数据科学家成长指南,长居美亚机器学习热销榜; 2.新版基于Python 3.6,新引了类型注释等许多功能; 3.根据数据科学近几年的发展,新增了关于深度学习、统计学和自然语言处理等主题,让图书内容与时俱。 - 学到一堂Python速成课。 - 学习线性代数、统计学和概率论的基础知识,并能将其灵活地用于数据科学项目。 - 掌握如何获取、探索、清洗、处理和调整数据。
售 价:¥
纸质售价:¥74.10购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
版权声明
O'Reilly Media, Inc. 介绍
业界评论
第2版前言
排版约定
使用示例代码
O'Reilly在线学习平台(O'Reilly Online Learning)
联系我们
致谢
更多信息
第1版前言
数据科学
从零开始
第 1 章 导论
1.1 数据的崛起
1.2 什么是数据科学
1.3 激励假设:DataSciencester
1.3.1 寻找关键联系人
1.3.2 你可能知道的数据科学家
1.3.3 工资和工作年限
1.3.4 付费账户
1.3.5 感兴趣的主题
1.3.6 展望
第 2 章 Python速成
2.1 Python之禅
2.2 获取Python
2.3 虚拟环境
2.4 空白格式
2.5 模块
2.6 函数
2.7 字符串
2.8 异常
2.9 列表
2.10 元组
2.11 字典
defaultdict
2.12 计数器
2.13 集
2.14 控制流
2.15 真和假
2.16 排序
2.17 列表解析
2.18 自动化测试和断言
2.19 面向对象编程
2.20 迭代器和生成器
2.21 随机性
2.22 正则表达式
2.23 函数式编程
2.24 压缩和参数拆分
2.25 args和kwargs
2.26 类型注释
如何编写类型注释
2.27 欢迎来到DataSciencester
2.28 进一步探索
第 3 章 数据可视化
3.1 matplotlib
3.2 条形图
3.3 线图
3.4 散点图
3.5 延伸学习
第 4 章 线性代数
4.1 向量
4.2 矩阵
4.3 延伸学习
第 5 章 统计学
5.1 描述单个数据集
5.1.1 中心倾向
5.1.2 离散度
5.2 相关
5.3 辛普森悖论
5.4 相关系数的其他注意事项
5.5 相关与因果
5.6 延伸学习
第 6 章 概率
6.1 依赖和独立
6.2 条件概率
6.3 贝叶斯定理
6.4 随机变量
6.5 连续分布
6.6 正态分布
6.7 中心极限定理
6.8 延伸学习
第 7 章 假设和推论
7.1 统计假设检验
7.2 实例:掷硬币
7.3 值
7.4 置信区间
7.5 p-Hacking
7.6 实例:运行A/B测试
7.7 贝叶斯推断
7.8 延伸学习
第 8 章 梯度下降
8.1 梯度下降的思想
8.2 估算梯度
8.3 使用梯度
8.4 选择正确步长
8.5 使用梯度下降拟合模型
8.6 小批次梯度下降和随机梯度下降
8.7 延伸学习
第 9 章 获取数据
9.1 stdin和stdout
9.2 读取文件
9.2.1 文本文件的基础
9.2.2 限制的文件
9.3 网络抓取
HTML和解析方法
9.4 使用API
9.4.1 JSON和XML
9.4.2 使用无验证的API
9.4.3 寻找API
9.5 实例:使用Twitter API
获取证明文件
9.6 延伸学习
第 10 章 数据工作
10.1 探索数据
10.1.1 探索一维数据
10.1.2 两个维度
10.1.3 多维数据
10.2 使用NamedTuple
10.3 数据类
10.4 清洗和修改
10.5 数据处理
10.6 数据调整
10.7 题外话:tqdm
10.8 降维
10.9 延伸学习
第 11 章 机器学习
11.1 建模
11.2 什么是机器学习
11.3 过拟合与欠拟合
11.4 正确性
11.5 偏差-方差权衡
11.6 特征提取与选择
11.7 延伸学习
第 12 章 k 最近邻法
12.1 模型
12.2 实例:鸢尾花数据集
12.3 维数灾难
12.4 进一步探索
第 13 章 朴素贝叶斯算法
13.1 一个简易的垃圾邮件过滤器
13.2 一个复杂的垃圾邮件过滤器
13.3 算法实现
13.4 测试模型
13.5 使用模型
13.6 延伸学习
第 14 章 简单线性回归
14.1 模型
14.2 使用梯度下降法
14.3 最大似然估计
14.4 延伸学习
第 15 章 多元回归
15.1 模型
15.2 最小二乘模型的进一步假设
15.3 拟合模型
15.4 解释模型
15.5 拟合优度
15.6 题外话:Bootstrap
15.7 回归系数的标准误差
15.8 正则化
15.9 延伸学习
第 16 章 逻辑回归
16.1 问题
16.2 logistic函数
16.3 应用模型
16.4 拟合优度
16.5 支持向量机
16.6 延伸学习
第 17 章 决策树
17.1 什么是决策树
17.2 熵
17.3 分割的熵
17.4 创建决策树
17.5 综合运用
17.6 随机森林
17.7 延伸学习
第 18 章 神经网络
18.1 感知器
18.2 前馈神经网络
18.3 反向传播
18.4 实例:Fizz Buzz
18.5 延伸学习
第 19 章 深度学习
19.1 张量
19.2 层抽象
19.3 线性层
19.4 把神经网络作为层序列
19.5 损失函数与优化器
19.6 实例:重新设计异或网络
19.7 其他激活函数
19.8 实例:重新解决Fizz Buzz问题
19.9 softmax函数和交叉熵
19.10 丢弃
19.11 实例:MNIST
19.12 保存和加载模型
19.13 延伸学习
第 20 章 聚类分析
20.1 原理
20.2 模型
20.3 实例:聚会
20.4 选择聚类数目 k
20.5 实例:色彩聚类
20.6 自下而上的分层聚类
20.7 延伸学习
第 21 章 自然语言处理
21.1 词云
21.2 n-gram语言模型
21.3 语法
21.4 题外话:吉布斯采样
21.5 主题建模
21.6 词向量
21.7 递归神经网络
21.8 实例:使用字符级RNN
21.9 延伸学习
第 22 章 网络分析
22.1 中介中心性
22.2 特征向量中心性
22.2.1 矩阵乘法
22.2.2 中心性
22.3 有向图与PageRank
22.4 延伸学习
第 23 章 推荐系统
23.1 人工管理
23.2 推荐流行事务
23.3 基于用户的协同过滤
23.4 基于项目的协同过滤
23.5 矩阵分解
23.6 延伸学习
第 24 章 数据库与 SQL
24.1 CREATE TABLE与INSERT
24.2 UPDATE
24.3 DELETE
24.4 SELECT
24.5 GROUP BY
24.6 ORDER BY
24.7 JOIN
24.8 子查询
24.9 索引
24.10 查询优化
24.11 NoSQL
24.12 延伸学习
第 25 章 MapReduce
25.1 实例:单词计数
25.2 为什么是MapReduce
25.3 更一般化的MapReduce
25.4 实例:状态分析更新
25.5 实例:矩阵乘法
25.6 题外话:组合器
25.7 延伸学习
第 26 章 数据伦理
26.1 什么是数据伦理
26.2 讲真的,什么是数据伦理
26.3 是否应该关注数据伦理
26.4 建立不良数据产品
26.5 精确与公平之间的较量
26.6 合作
26.7 可解释性
26.8 推荐
26.9 异常数据
26.10 数据保护
26.11 小结
26.12 延伸学习
第 27 章 数据科学前瞻
27.1 IPython
27.2 数学
27.3 不从零开始
27.3.1 NumPy
27.3.2 pandas
27.3.3 scikit-learn
27.3.4 可视化
27.3.5 R
27.3.6 深度学习
27.4 寻找数据
27.5 从事数据科学工作
27.5.1 Hacker News
27.5.2 消防车
27.5.3 T恤
27.5.4 地球仪上的推文
27.5.5 你的发现
关于作者
关于封面
看完了
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜