万本电子书0元读

万本电子书0元读

顶部广告

商战数据挖掘:你需要了解的数据科学与分析思维电子书

数据科学领域元老级学者倾力造,SAP全球副总裁推荐 畅销九个国家和地区,被20余所大学作为教科书 数据科学商业应用的门指南,现代企业科学经营手册 不同于其他讲述数据科学的书,本书从非数据科学人员,也就是管理者、投资者甚至工程师等人员的角度,阐述了数据科学这一新兴行业的基本原理和基础理念,而这正是本书的惊艳之处。 在现代社会中,数据即商业,它是提升生产力、促创新和获取用户洞见的基础,数据思维和分析方法可谓是新时代的商战孙子兵法,只有善用数据者才能在这个数据驱动的环境中获得竞争优势。本书通过大量真实的商业问题案例,介绍数据科学的基本原理和各种数据挖掘技术,阐释如何从数据中提取出有用信息,而用数据科学方法解决商业问题,做出精准的决策。

售       价:¥

纸质售价:¥66.20购买纸书

162人正在读 | 2人评论 6.2

作       者:(美)福斯特·普罗沃斯特(Foster Provost),汤姆·福西特(Tom Fawcett)

出  版  社:人民邮电出版社有限公司

出版时间:2019-12-01

字       数:25.9万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
数据挖掘是现代企业从数据中提取有用信息、获取竞争优势的重要方法。针对数据科学的这一商业应用,本书行了深解读,不仅详细介绍了数据挖掘的环节、常用分析技术和基本模型,还提供了数据科学解决方案的提案示例和评估指南。同时,为了便于读者理解,本书不仅分析了大量商业示例,在业务情景下阐释数据挖掘的基本概念和原理,还使用大量图表辅助解释数学细节。因此,读者无需专业数学背景即可阅读本书。<br/>【推荐语】<br/>数据科学领域元老级学者倾力造,SAP全球副总裁推荐 畅销九个国家和地区,被20余所大学作为教科书 数据科学商业应用的门指南,现代企业科学经营手册 不同于其他讲述数据科学的书,本书从非数据科学人员,也就是管理者、投资者甚至工程师等人员的角度,阐述了数据科学这一新兴行业的基本原理和基础理念,而这正是本书的惊艳之处。 在现代社会中,数据即商业,它是提升生产力、促创新和获取用户洞见的基础,数据思维和分析方法可谓是新时代的商战孙子兵法,只有善用数据者才能在这个数据驱动的环境中获得竞争优势。本书通过大量真实的商业问题案例,介绍数据科学的基本原理和各种数据挖掘技术,阐释如何从数据中提取出有用信息,而用数据科学方法解决商业问题,做出精准的决策。<br/>【作者】<br/>福斯特·普罗沃斯特(Foster Provost) 纽约大学斯特恩商学院教授,教授商业分析、数据科学与MBA课程。他曾是Verizon公司研究型数据科学家,参与创建过多家成功的数据科学驱动企业。 汤姆·福西特(Tom Fawcett) 机器学*,Data Science LLC首席数据科学家,从事应用机器学习研究和数据挖掘20余年,发表过大量机器学习文章。<br/>
目录展开

版权声明

O'Reilly Media, Inc. 介绍

赞誉

译者序

前言

第 1 章 绪论:数据分析式思维

1.1 数据机遇无处不在

1.2 案例:飓风Frances

1.3 案例:预测用户流失

1.4 数据科学、数据工程和数据驱动型决策

1.5 数据处理和“大数据”

1.6 从大数据1.0到大数据2.0

1.7 数据与数据科学能力:一种战略性资产

1.8 数据分析式思维

1.9 关于本书

1.10 重新审视数据挖掘和数据科学

1.11 数据科学:一门新兴的实验性学科

1.12 小结

第 2 章 商业问题及其数据科学解决方案

2.1 从商业问题到数据挖掘任务

2.2 有监督方法与无监督方法

2.3 数据挖掘及其结果

2.4 数据挖掘流程

2.5 管理数据科学团队的含义

2.6 其他分析技巧与技术

2.7 小结

第 3 章 预测建模导论:从相关性到有监督的划分

3.1 建模、归纳与预测

3.2 有监督的划分

3.3 划分的可视化

3.4 把树视作规则组

3.5 概率估计

3.6 示例:用树型归纳解决用户流失问题

3.7 小结

第 4 章 用模型拟合数据

4.1 根据数学函数分类

4.2 通过数学函数进行回归

4.3 类概率估计和逻辑“回归”

4.4 示例:对比逻辑回归和树型归纳

4.5 非线性函数、支持向量机和神经网络

4.6 小结

第 5 章 避免过拟合

5.1 泛化能力

5.2 过拟合

5.3 过拟合检验

5.4 示例:线性函数的过拟合

5.5 *示例:过拟合为何有害

5.6 从保留评估到交叉验证

5.7 用户流失数据集回顾

5.8 学习曲线

5.9 避免过拟合与控制复杂度

5.10 小结

第 6 章 相似性、近邻和簇

6.1 相似性和距离

6.2 最近邻推理

6.3 与相似性和最近邻相关的一些重要技术细节

6.4 聚类

6.5 退一步:解决业务问题与数据探索

6.6 小结

第 7 章 决策分析思维(一):如何评估一个模型

7.1 对分类器的评估

7.2 分类问题的推广

7.3 一个重要的分析框架:期望值

7.4 评估、基线性能以及对数据投资的意义

7.5 小结

第 8 章 模型性能的可视化

8.1 排序,而不是分类

8.2 利润曲线

8.3 ROC图像和曲线

8.4 ROC曲线下面积

8.5 累积响应曲线和提升曲线

8.6 示例:用户流失模型的性能分析

8.7 小结

第 9 章 证据和概率

9.1 示例:向线上目标用户投放广告

9.2 根据概率合并证据

9.3 将贝叶斯法则应用到数据科学中

9.4 证据“提升度”的模型

9.5 示例:Facebook“点赞”的证据提升度

9.6 小结

第 10 章 文本的表示和挖掘

10.1 为什么文本很重要

10.2 为什么文本很难处理

10.3 表示法

10.4 示例:爵士音乐家

10.5 *IDF和熵的关系

10.6 词袋模型之外的方法

10.7 示例:通过挖掘新闻报道预测股价变动

10.8 小结

第 11 章 决策分析思维(二):面向分析工程

11.1 为慈善机构寻找最佳捐赠人

11.2 更复杂的用户流失示例回顾

11.3 小结

第 12 章 其他数据科学任务与技术

12.1 共现和关联:寻找匹配项

12.2 用户画像:寻找典型行为

12.3 链路预测和社交推荐

12.4 数据约简、潜在信息和电影推荐

12.5 偏差、方差和集成方法

12.6 数据驱动的因果解释和一个病毒式营销示例

12.7 小结

第 13 章 数据科学和经营战略

13.1 数据分析式思维,终极版

13.2 用数据科学取得竞争优势

13.3 用数据科学保持竞争优势

13.4 吸引和培养数据科学家及其团队

13.5 检验数据科学案例分析

13.6 做好准备,接受来源各异的创意

13.7 做好准备,评估数据科学项目提案

13.8 企业的数据科学成熟度

第 14 章 总结

14.1 数据科学的基本概念

14.2 数据做不到的:圈中人回顾

14.3 隐私、道德和挖掘个人数据

14.4 数据科学是否还有更多内容

14.5 最后一例:从众包到云包

14.6 最后的话

附录 A 提案评估指南

A.1 业务和数据理解

A.2 数据准备

A.3 建模

A.4 评估和部署

附录 B 另一个提案示例

情景和提案

术语表

参考文献

关于作者

看完了

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部