万本电子书0元读

万本电子书0元读

顶部广告

数据科学:理论、方法与R语言实践电子书 租阅

售       价:¥

纸质售价:¥54.50购买纸书

149人正在读 | 2人评论 6.2

作       者:(美)朱梅尔(Zumel,N.),(美)芒特(Mount,J.)

出  版  社:机械工业出版社

出版时间:2016-03-01

字       数:25.5万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(2条)
  • 读书简介
  • 目录
  • 累计评论(2条)
本书从实用的角度较为全面地展现了数据科学的主要内容,并结合大量的实际项目案例,利用R语言详细地讲解了数据项目的开发过程和关键技术。本书包括三个部分共11章的内容,主要介绍了数据科学项目的处理过程、选择合适的建模方法,也讨论了bagging算法、*森林、广义加性模型、核和支持向量机等高级建模方法。此外,还讨论了文档编制和结果部署,以及如何向组织内不同的受众展现项目结果。本书适合作为高等院校高年级本科生和研究生及从事数据管理与分析工程技术人员的主要参考书。 本书从实用的角度较为全面地展现了数据科学的主要内容,并结合大量的实际项目案例,利用R语言详细地讲解了数据项目的发过程和关键技术。本书包括三个部分共11章的内容,主要介绍了数据科学项目的处理过程、选择合适的建模方法,也讨论了bagging算法、*森林、广义加性模型、核和支持向量机等高级建模方法。此外,还讨论了文档编制和结果部署,以及如何向组织内不同的受众展现项目结果。本书适合作为高等院校高年级本科生和研究生及从事数据管理与分析工程技术人员的主要参考书。
目录展开

译者序

序言

前言

第一部分 数据科学引论

第1章 数据科学处理过程

1.1 数据科学项目中的角色

1.2 数据科学项目的阶段

1.3 设定预期

1.4 小结

第2章 向R加载数据

2.1 运用文件中的数据

2.2 在关系数据库上使用R

2.3 小结

第3章 探索数据

3.1 使用概要统计方法发现问题

3.2 用图形和可视化方法发现问题

3.3 小结

第4章 管理数据

4.1 清洗数据

4.2 为建模和验证采样

4.3 小结

第二部分 建模方法

第5章 选择和评价模型

5.1 将业务问题映射到机器学习任务

5.2 模型评价

5.3 模型验证

5.4 小结

第6章 记忆化方法

6.1 KDD和KDD Cup 2009

6.2 构建单变量模型

6.3 构建多变量模型

6.4 小结

第7章 线性回归与逻辑斯谛回归

7.1 使用线性回归

7.2 使用逻辑斯谛回归

7.3 小结

第8章 无监督方法

8.1 聚类分析

8.2 关联规则

8.3 小结

第9章 高级方法探索

9.1 使用bagging和随机森林方法减少训练方差

9.2 使用广义加性模型学习非单调关系

9.3 使用核方法提高数据可分性

9.4 使用SVM对复杂的决策边界建模

9.5 小结

第三部分 结果交付

第10章 文档编制和部署

10.1 buzz数据集

10.2 使用knitr产生里程碑文档

10.3 在运行时文档编制中使用注释和版本控制

10.4 模型部署

10.5 小结

第11章 有效的结果展现

11.1 将结果展现给项目出资方

11.2 向最终用户展现模型

11.3 向其他数据科学家展现你的工作

11.4 小结

附录A 使用R和其他工具

附录B 重要的统计学概念

附录C 更多的工具和值得探索的思路

参考文献

索引

累计评论(2条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部