数据科学领域元老级学者倾力造,SAP全球副总裁推荐 畅销九个国家和地区,被20余所大学作为教科书 数据科学商业应用的门指南,现代企业科学经营手册 不同于其他讲述数据科学的书,本书从非数据科学人员,也就是管理者、投资者甚至工程师等人员的角度,阐述了数据科学这一新兴行业的基本原理和基础理念,而这正是本书的惊艳之处。 在现代社会中,数据即商业,它是提升生产力、促创新和获取用户洞见的基础,数据思维和分析方法可谓是新时代的商战孙子兵法,只有善用数据者才能在这个数据驱动的环境中获得竞争优势。本书通过大量真实的商业问题案例,介绍数据科学的基本原理和各种数据挖掘技术,阐释如何从数据中提取出有用信息,而用数据科学方法解决商业问题,做出精准的决策。
售 价:¥
纸质售价:¥66.20购买纸书
温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印
为你推荐
版权声明
O'Reilly Media, Inc. 介绍
赞誉
译者序
前言
第 1 章 绪论:数据分析式思维
1.1 数据机遇无处不在
1.2 案例:飓风Frances
1.3 案例:预测用户流失
1.4 数据科学、数据工程和数据驱动型决策
1.5 数据处理和“大数据”
1.6 从大数据1.0到大数据2.0
1.7 数据与数据科学能力:一种战略性资产
1.8 数据分析式思维
1.9 关于本书
1.10 重新审视数据挖掘和数据科学
1.11 数据科学:一门新兴的实验性学科
1.12 小结
第 2 章 商业问题及其数据科学解决方案
2.1 从商业问题到数据挖掘任务
2.2 有监督方法与无监督方法
2.3 数据挖掘及其结果
2.4 数据挖掘流程
2.5 管理数据科学团队的含义
2.6 其他分析技巧与技术
2.7 小结
第 3 章 预测建模导论:从相关性到有监督的划分
3.1 建模、归纳与预测
3.2 有监督的划分
3.3 划分的可视化
3.4 把树视作规则组
3.5 概率估计
3.6 示例:用树型归纳解决用户流失问题
3.7 小结
第 4 章 用模型拟合数据
4.1 根据数学函数分类
4.2 通过数学函数进行回归
4.3 类概率估计和逻辑“回归”
4.4 示例:对比逻辑回归和树型归纳
4.5 非线性函数、支持向量机和神经网络
4.6 小结
第 5 章 避免过拟合
5.1 泛化能力
5.2 过拟合
5.3 过拟合检验
5.4 示例:线性函数的过拟合
5.5 *示例:过拟合为何有害
5.6 从保留评估到交叉验证
5.7 用户流失数据集回顾
5.8 学习曲线
5.9 避免过拟合与控制复杂度
5.10 小结
第 6 章 相似性、近邻和簇
6.1 相似性和距离
6.2 最近邻推理
6.3 与相似性和最近邻相关的一些重要技术细节
6.4 聚类
6.5 退一步:解决业务问题与数据探索
6.6 小结
第 7 章 决策分析思维(一):如何评估一个模型
7.1 对分类器的评估
7.2 分类问题的推广
7.3 一个重要的分析框架:期望值
7.4 评估、基线性能以及对数据投资的意义
7.5 小结
第 8 章 模型性能的可视化
8.1 排序,而不是分类
8.2 利润曲线
8.3 ROC图像和曲线
8.4 ROC曲线下面积
8.5 累积响应曲线和提升曲线
8.6 示例:用户流失模型的性能分析
8.7 小结
第 9 章 证据和概率
9.1 示例:向线上目标用户投放广告
9.2 根据概率合并证据
9.3 将贝叶斯法则应用到数据科学中
9.4 证据“提升度”的模型
9.5 示例:Facebook“点赞”的证据提升度
9.6 小结
第 10 章 文本的表示和挖掘
10.1 为什么文本很重要
10.2 为什么文本很难处理
10.3 表示法
10.4 示例:爵士音乐家
10.5 *IDF和熵的关系
10.6 词袋模型之外的方法
10.7 示例:通过挖掘新闻报道预测股价变动
10.8 小结
第 11 章 决策分析思维(二):面向分析工程
11.1 为慈善机构寻找最佳捐赠人
11.2 更复杂的用户流失示例回顾
11.3 小结
第 12 章 其他数据科学任务与技术
12.1 共现和关联:寻找匹配项
12.2 用户画像:寻找典型行为
12.3 链路预测和社交推荐
12.4 数据约简、潜在信息和电影推荐
12.5 偏差、方差和集成方法
12.6 数据驱动的因果解释和一个病毒式营销示例
12.7 小结
第 13 章 数据科学和经营战略
13.1 数据分析式思维,终极版
13.2 用数据科学取得竞争优势
13.3 用数据科学保持竞争优势
13.4 吸引和培养数据科学家及其团队
13.5 检验数据科学案例分析
13.6 做好准备,接受来源各异的创意
13.7 做好准备,评估数据科学项目提案
13.8 企业的数据科学成熟度
第 14 章 总结
14.1 数据科学的基本概念
14.2 数据做不到的:圈中人回顾
14.3 隐私、道德和挖掘个人数据
14.4 数据科学是否还有更多内容
14.5 最后一例:从众包到云包
14.6 最后的话
附录 A 提案评估指南
A.1 业务和数据理解
A.2 数据准备
A.3 建模
A.4 评估和部署
附录 B 另一个提案示例
情景和提案
术语表
参考文献
关于作者
看完了
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜