万本电子书0元读

万本电子书0元读

顶部广告

Python大规模机器学习电子书 租阅

售       价:¥

纸质售价:¥80.30购买纸书

128人正在读 | 0人评论 6.2

作       者:(荷)巴斯蒂安·贾丁(Bastiaan Sjardin)

出  版  社:机械工业出版社

出版时间:2019-02-01

字       数:15.4万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书不仅介绍大规模机器学习的基本概念,还包含丰富的案例研究。书中所选皆为*实用的技术和工具,而对理论细节不行深讨论,旨在提供大规模机器学习方法(甚至非常规方法)。不管是初学者、普通用户还是专家级用户,通过本书都能理解并掌握利用Python行大规模机器学习。为让读者快速掌握核心技术,本书由浅深讲解大量实例,图文并茂呈现每一步的操作结果,帮助读者更好地掌握大规模机器学习Python工具。例如:基于Scikit-learn可扩展学习、 Liblinear和Vowpal Wabbit快速支持向量机、基于Theano与H2O的大规模深度学习方法、TensorFlow深度学习技术与在线神经网络方法、大规模分类和回归树的可扩展解决方案、大规模无监督学习(PCA,聚类分析和主题建模等)扩展方法、Hadoop和Spark分布式环境、Spark机器学习实践以及Theano和GPU计算的基础知识。 本书不仅介绍大规模机器学习的基本概念,还包含丰富的案例研究。书中所选皆为*实用的技术和工具,而对理论细节不行深讨论,旨在提供大规模机器学习方法(甚至非常规方法)。不管是初学者、普通用户还是专家级用户,通过本书都能理解并掌握利用Python行大规模机器学习。为让读者快速掌握核心技术,本书由浅深讲解大量实例,图文并茂呈现每一步的操作结果,帮助读者更好地掌握大规模机器学习Python工具。例如:基于Scikit-learn可扩展学习、 Liblinear和Vowpal Wabbit快速支持向量机、基于Theano与H2O的大规模深度学习方法、TensorFlow深度学习技术与在线神经网络方法、大规模分类和回归树的可扩展解决方案、大规模无监督学习(PCA,聚类分析和主题建模等)扩展方法、Hadoop和Spark分布式环境、Spark机器学习实践以及Theano和GPU计算的基础知识。
【作者】
Bastiaan Sjardin是一位具有人工智能和数学背景的数据科学家和公司创始人。他获得莱顿大学和麻省理工学院(MIT)校园课程联合培养的认知科学硕士学位。在过去五年中,他从事过广泛的数据科学和人工智能项目。他是密歇根大学社会网络分析课程Coursera和约翰斯·霍普金斯大学机器学习实践课程的常客。他擅长Python和R编程语言。目前,他是Quandbee(http://wwwquandbeecom)的联合创始人,该公司主要提供大规模机器学习和人工智能应用。 Luca Massaron是一位数据科学家和市场研究总监,擅长多元统计分析、机器学习和客户洞察力研究,在解决实际问题和应用推理、统计、数据挖掘和算法来为用户创造价值方面有十多年经验。从成为意大利网络观众分析的先驱,到跻身前十名的Kaggler,他一直对数据分析充满热情,还向专业人士和普通大众展示数据驱动知识发现的潜力,相比不必要的复杂性,他更喜欢简洁。他相信仅仅通过基本操作就可以在数据科学中收获很多东西。 Alberto Boschetti是一位具有信号处理和统计专业知识的数据科学家。他获得电信工程博士学位,目前在伦敦生活和工作。在其工作项目中,他面临过从自然语言处理(NLP)和机器学习到分布式处理的挑战。 他在工作中充满热情,始终努力了解数据科学的*新发展,他喜欢参加聚会、会议和其他活动。
目录展开

译者序

前言

作者简介

审校者简介

第1章 迈向可扩展性的第一步

1.1 详细解释可扩展性

1.2 Python用于大规模机器学习

1.3 Python包

第2章 Scikit-learn中的可扩展学习

2.1 非核心学习

2.2 流化源数据

2.3 随机学习

2.4 数据流的特征管理

2.5 小结

第3章 实现快速SVM

3.1 测试数据集

3.2 支持向量机

3.3 正则化特征选择

3.4 SGD中的非线性

3.5 超参数调整

3.6 小结

第4章 神经网络与深度学习

4.1 神经网络架构

4.2 神经网络和正则化

4.3 神经网络和超参数优化

4.4 神经网络和决策边界

4.5 用H2O进行规模化深度学习

4.6 深度学习和无监督预训练

4.7 使用theanets进行深度学习

4.8 自动编码器和无监督学习

4.9 小结

第5章 用TensorFlow进行深度学习

5.1 TensorFlow安装

5.2 在TensorFlow上使用SkFlow进行机器学习

5.3 安装Keras和TensorFlow

5.4 在TensorFlow中通过Keras实现卷积神经网络

5.5 增量CNN方法

5.6 GPU计算

5.7 小结

第6章 大规模分类和回归树

6.1 bootstrap聚合

6.2 随机森林和极端随机森林

6.3 随机搜索实现快速参数优化

6.4 CART和boosting

6.5 XGBoost

6.6 用H2O实现非核心CART

6.7 小结

第7章 大规模无监督学习

7.1 无监督方法

7.2 特征分解:PCA

7.3 使用H2O的PCA

7.4 K-均值聚类算法

7.5 用H2O实现K-均值

7.6 LDA

7.7 小结

第8章 分布式环境——Hadoop和Spark

8.1 从单机到集群

8.2 设置VM

8.3 Hadoop生态系统

8.4 Spark

8.5 小结

第9章 Spark机器学习实践

9.1 为本章设置虚拟机

9.2 跨集群节点共享变量

9.3 Spark的数据预处理

9.4 Spark机器学习

9.5 小结

附录 介绍GPU和Theano

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部