万本电子书0元读

万本电子书0元读

顶部广告

精通数据科学算法电子书

机器学习的应用是高度自度化且自动修正的。学习到的数据越多,机器学习应用需要的人工干预越少。为了解决现实世界中复杂的数据问题,科学家们发出专门的机器学习算法来解决这些问题。数据科学正是通过算法和统计分析来帮助读者从现有数据中获取新知识的。 本书将解决如何高效地行数据分类及预测的问题。本书主要讲解7种数据科学算法,有k*近邻算法、朴素贝叶斯算法、决策树、随机森林,k-means聚类、回归分析和时间序列分析。 此外,你还会掌握如何对数据行预聚类,以便针对大型数据集行优化和分类。*后,你将了解如何根据数据集中的现有趋势来预测数据。本书的各章还有配套的练习题,以帮助你夯实内容,扩展相关知识。

售       价:¥

纸质售价:¥46.60购买纸书

77人正在读 | 2人评论 6.2

作       者:(英)戴维·纳蒂加(David Natingga)

出  版  社:人民邮电出版社有限公司

出版时间:2019-05-01

字       数:12.3万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(1条)
  • 读书简介
  • 目录
  • 累计评论(1条)
数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。 本书讲解了7种重要的数据分析方法,它们分别是k*近邻算法、朴素贝叶斯算法、决策树、随机森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子始,先讲解算法的基本概念与知识,然后通过对案例行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。 本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。<br/>【推荐语】<br/>机器学习的应用是高度自度化且自动修正的。学习到的数据越多,机器学习应用需要的人工干预越少。为了解决现实世界中复杂的数据问题,科学家们发出专门的机器学习算法来解决这些问题。数据科学正是通过算法和统计分析来帮助读者从现有数据中获取新知识的。 本书将解决如何高效地行数据分类及预测的问题。本书主要讲解7种数据科学算法,有k*近邻算法、朴素贝叶斯算法、决策树、随机森林,k-means聚类、回归分析和时间序列分析。 此外,你还会掌握如何对数据行预聚类,以便针对大型数据集行优化和分类。*后,你将了解如何根据数据集中的现有趋势来预测数据。本书的各章还有配套的练习题,以帮助你夯实内容,扩展相关知识。 读完本书后,你将了解如何选择机器学习算法行聚类、分类或回归,并知道选择哪种算法来解决实际问题。 本书主要包括以下内容: 如何使用朴素贝叶斯、决策树和随机森林行分类并准确地解决复杂问题; 正确识别数据科学问题并使用回归分析和时间序列分析设计合适的预测解决方案; 如何使用 k-means算法对数据行聚类; 如何使用Python和R语言有效地实现算法。<br/>【作者】<br/>Dávid Natingga于2014年毕业于伦敦帝国理工学院的计算与人工智能专业,并获工程硕士学位。2011年,他在印度班加罗尔的Infosys实验室工作,研究机器学习算法的优化。2012~2013年,他在美国帕罗奥图的Palantir技术公司从事大数据算法的发工作。2014年,作为英国伦敦Pact Coffee公司的数据科学家,他设计了一种基于顾客口味偏好和咖啡结构的推荐算法。2017年,他在荷兰阿姆斯特丹的TomTom工作,处理导航平台的地图数据。 他是英国利兹大学计算理论专业的博士研究生,研究纯数学如何推人工智能。2016年,他在日本高等科学技术学院当了8个月的访问学者。<br/>
目录展开

版权声明

内容提要

作者简介

致谢

评阅者简介

前言

资源与支持

第1章 用k最近邻算法解决分类问题

1.1 Mary对温度的感觉

1.2 实现k最近邻算法

1.3 意大利地区的示例——选择k值

1.4 房屋所有权——数据转换

1.5 文本分类——使用非欧几里德距离

1.6 文本分类——更高维度的k-NN

1.7 小结

1.8 习题

第2章 朴素贝叶斯

2.1 医疗检查——贝叶斯定理的基本应用

2.2 贝叶斯定理的证明及其扩展

2.3 西洋棋游戏——独立事件

2.4 朴素贝叶斯分类器的实现

2.5 西洋棋游戏——相关事件

2.6 性别分类——基于连续随机变量的贝叶斯定理

2.7 小结

2.8 习题

第3章 决策树

3.1 游泳偏好——用决策树表示数据

3.2 信息论

3.3 ID3算法——构造决策树

3.4 用决策树进行分类

3.5 小结

3.6 习题

第4章 随机森林

4.1 随机森林算法概述

4.2 游泳偏好——随机森林分析法

4.3 随机森林算法的实现

4.4 下棋实例

4.5 购物分析——克服随机数据的不一致性以及度量置信水平

4.6 小结

4.7 习题

第5章 k-means聚类

5.1 家庭收入——聚类为k个簇

5.2 性别分类——聚类分类

5.3 k-means聚类算法的实现

5.4 房产所有权示例——选择簇的数量

5.5 小结

5.6 习题

第6章 回归分析

6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归

6.2 根据身高预测体重——基于实际数据的线性回归

6.3 梯度下降算法及实现

6.4 根据距离预测飞行时长

6.5 弹道飞行分析——非线性模型

6.6 小结

6.7 习题

第7章 时间序列分析

7.1 商业利润——趋势分析

7.2 电子商店的销售额——季节性分析

7.3 小结

7.4 习题

附录A 统计

A.1 基本概念

A.2 贝叶斯推理

A.3 分布

A.4 交叉验证

A.5 A/B测试

附录B R参考

B.1 介绍

B.2 数据类型

B.3 线性回归

附录C Python参考

C.1 介绍

C.2 数据类型

C.3 控制流

附录D 数据科学中的算法和方法术语

累计评论(1条) 1个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部