万本电子书0元读

万本电子书0元读

顶部广告

Spark 深度学习指南电子书

√丰富的案例解析,书中展示了Spark在各行各业做深度学习的应用实例。 √基于Python,与当前主流深度学习库(TensorFlow和Keras等)结合,教你如何在Spark中实现和部署深度学习模型。 √本书以即学即用的方式行讲解,任何没有编程经验的人,即使是没有使用过Python语言的人,都可以按照提示逐步地轻松实现本书中的算法。

售       价:¥

纸质售价:¥81.70购买纸书

40人正在读 | 0人评论 6.2

作       者:(美)Ahmed Sherif(艾哈迈德·谢里夫), Amrith Ravindra(阿姆里斯·拉文德拉)

出  版  社:电子工业出版社

出版时间:2019-12-01

字       数:11.5万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书头部分讲了如何按照深度学习的需求来配置Apache Spark,以实现不同类型的神经网络,下来讲述了在分布式环境中实现深度学习涉及的常见和不那么常见的需求。另外,你还将学到Spark中的深度学习代码,这些代码可以复用到其他类似的问题中,或者稍作改动用于略有不同的问题。本书将带你一起用Spark对数据行分流和聚类,用TensorFlow、Deeplearning4j和 Caffe在Spark中实现和部署深度学习模型,例如CNN、RNN和 LSTM。学完本书的内容,你将能够在Spark上训练和部署有效的深度学习模型。<br/>【推荐语】<br/>√丰富的案例解析,书中展示了Spark在各行各业做深度学习的应用实例。 √基于Python,与当前主流深度学习库(TensorFlow和Keras等)结合,教你如何在Spark中实现和部署深度学习模型。 √本书以即学即用的方式行讲解,任何没有编程经验的人,即使是没有使用过Python语言的人,都可以按照提示逐步地轻松实现本书中的算法。<br/>【作者】<br/>Ahmed Sherif是一名数据科学家,自2005年以来一直从事各种角色的数据研究。他从2013年始使用BI解决方案并慢慢转向数据科学。2016年,他从西北大学获得了预测分析硕士学位,在那里他研究深度学习的科学与应用和同时使用Python和R语言的预测建模。近,他一直在使用Azure在云端发机器学习和深度学习解决方案。2016年,他出版了他的本书《实用商业智能》。他目前是微软的数据和人工智能技术解决方案专业人员。 Amrith Ravindra博士是一位机器学习爱好者,拥有电气与工业工程学位。在攻读硕士学位的过程中,他更深地研究机器学习世界,并培养了对数据科学的热爱。工程专业的研究生课程给他提供了数学背景,使他深度学习的职业生涯。他在坦帕市举行的当地数据科学聚会上会见了Ahmed Sherif。他们决定合作写一本关于他们喜欢的机器学习算法的书。他希望这本书能够帮助他实现成为数据科学家并积极为机器学习做出贡献的终目标。 黄友良,计算机应用技术专业博士,毕业于北京师范大学,2009年7月-至今就职于北京中医药大学管理学院,中华医学会教育技术分会第八、九届委员会青年委员,中国中医药信息研究会人工智能分会理事,Adobe中国认证讲师。<br/>
目录展开

版权页

译者序

编著者

前言

1 为深度学习开发设置Spark

介绍

下载Ubuntu桌面映像

在macOS中使用VMWare Fusion安装和配置Ubuntu

在Windows中使用Oracle VirtualBox安装和配置Ubuntu

为谷歌云平台安装和配置Ubuntu桌面端

在Ubuntu桌面端安装和配置Spark

集成Jupyter Notebook与Spark

启动和配置Spark集群

停止Spark集群

2 在Spark中创建神经网络

介绍

在PySpark中创建数据帧

在PySpark数据帧中操作列

将PySpark数据帧转换为数组

在散点图中将数组可视化

设置输入神经网络的权重和偏差

规范化神经网络的输入数据

验证数组以获得最佳的神经网络性能

使用sigmoid设置激活函数

创建sigmoid导数

计算神经网络中的代价函数

根据身高值和体重值预测性别

预测分数并进行可视化

3 卷积神经网络的难点

介绍

难点1:导入MNIST图像

难点2:可视化MNIST图像

难点3:将MNIST图像导出为文件

难点4:增加MNIST图像

难点5:利用备用资源训练图像

难点6:为卷积神经网络优先考虑高级库

4 循环神经网络的难点

介绍

前馈网络简介

循环神经网络的顺序工作

难点1:梯度消失问题

难点2:梯度爆炸问题

长短期记忆单元的顺序工作

5 用Spark机器学习预测消防部门呼叫

介绍

下载旧金山消防局呼叫数据集

识别逻辑回归模型的目标变量

为逻辑回归模型准备特征变量

应用逻辑回归模型

评估逻辑回归模型的准确度

6 在生成网络中使用LSTM

介绍

下载将用作输入文本的小说/书籍

准备和清理数据

标记句子

训练和保存LSTM模型

使用模型生成类似的文本

7 使用TF-IDF进行自然语言处理

介绍

下载治疗机器人会话文本数据集

分析治疗机器人会话数据集

数据集单词计数可视化

计算文本的情感分析

从文本中删除停用词

训练TF-IDF模型

评估TF-IDF模型性能

比较模型性能和基线分数

8 使用XGBoost进行房地产价值预测

下载金斯县房屋销售数据集

执行探索性分析和可视化

绘制价格与其他特征之间的相关性

预测房价

9 使用长短期记忆单元预测苹果公司股票市场价格

下载苹果公司的股票市场数据

探索和可视化苹果公司的股票市场数据

准备用于提升模型性能的股票市场数据

构建长短期记忆单元模型

评估长短期记忆单元模型

10 使用深度卷积网络进行人脸识别

介绍

下载MIT-CBCL数据集并将其加载到内存中

绘制并可视化目录中的图像

图像预处理

模型构建、训练和分析

11 使用Word2Vec创建和可视化单词向量

介绍

获取数据

导入必要的库

准备数据

构建和训练模型

进一步可视化

进一步分析

12 使用Keras创建电影推荐引擎

介绍

下载MovieLens数据集

操作和合并MovieLens数据集

探索MovieLens数据集

为深度学习流水线准备数据集

应用Keras深度学习模型

评估推荐引擎的准确度

13 使用TensorFIow在Spark中进行图像分类

介绍

下载梅西和罗纳尔多各30张图像

使用深度学习包安装PySpark

将图像加载到PySpark数据帧

理解迁移学习

创建用于图像分类训练的流水线

评估模型性能

微调模型参数

反侵权盗版声明

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部