1.在数据学科的角度,融合了数学、计算机科学、计量经济学的精髓。 2.为读者阐释了数据科学所要解决的核心问题—数据模型、算法模型的理论内涵和适用范围 3.以常用的IT工具—Python为基础,教会读者如何建模以及通过算法实现数据模型,具有很强的实操性。 4.本书还为读者详解了分布式机器学习、神经网络、深度学习等大数据和人工智能的前沿技术。 中国工程院院士、第三世界科学院院士、前中国科学院计算技术研究所所长李国杰,
售 价:¥
纸质售价:¥73.70购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
内容提要
序一
序二
序三
前言
本书内容
配套代码
说明
读者反馈
致谢
资源与支持
配套资源
提交勘误
与我们联系
关于异步社区和异步图书
第1章 数据科学概述
1.1 挑战
1.2 机器学习
1.3 统计模型
1.4 关于本书
第2章 Python安装指南与简介:告别空谈
2.1 Python简介
2.2 Python安装
2.3 Python上手实践
2.4 本章小结
第3章 数学基础:恼人但又不可或缺的知识
3.1 矩阵和向量空间
3.2 概率:量化随机
3.3 微积分
3.4 本章小结
第4章 线性回归:模型之母
4.1 一个简单的例子
4.2 上手实践:模型实现
4.3 模型陷阱
4.4 模型持久化
4.5 本章小结
第5章 逻辑回归:隐藏因子
5.1 二元分类问题:是与否
5.2 上手实践:模型实现
5.3 评估模型效果:孰优孰劣
5.4 多元分类问题:超越是与否
5.5 非均衡数据集
5.6 本章小结
第6章 工程实现:计算机是怎么算的
6.1 算法思路:模拟滚动
6.2 数值求解:梯度下降法
6.3 上手实践:代码实现
6.4 更优化的算法:随机梯度下降法
6.5 本章小结
第7章 计量经济学的启示:他山之石
7.1 定量与定性:变量的数学运算合理吗
7.2 定性变量的处理
7.3 定量变量的处理
7.4 显著性
7.5 多重共线性:多变量的烦恼
7.6 内生性:变化来自何处
7.7 本章小结
第8章 监督式学习:目标明确
8.1 支持向量学习机
8.2 核函数
8.3 决策树
8.4 树的集成
8.5 本章小结
第9章 生成式模型:量化信息的价值
9.1 贝叶斯框架
9.2 朴素贝叶斯
9.3 判别分析
9.4 隐马尔可夫模型
9.5 本章小结
第10章 非监督式学习:聚类与降维
10.1 K-means
10.2 其他聚类模型
10.3 Pipeline
10.4 主成分分析
10.5 奇异值分解
10.6 本章小结
第11章 分布式机器学习:集体力量
11.1 Spark简介
11.2 最优化问题的分布式解法
11.3 大数据模型的两个维度
11.4 开源工具的另一面
11.5 本章小结
第12章 神经网络:模拟人的大脑
12.1 神经元
12.2 神经网络
12.3 反向传播算法
12.4 提高神经网络的学习效率
12.5 本章小结
第13章 深度学习:继续探索
13.1 利用神经网络识别数字
13.2 卷积神经网络[6]
13.3 其他深度学习模型
13.4 本章小结
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜