万本电子书0元读

万本电子书0元读

顶部广告

人工智能技术与大数据电子书

1.本书对大数据与人工智能有一个综述性的介绍,包括大数据的本体论、机器学习的基本理论等内容,为具体场景、算法的实践奠定了基础。。 2.同时也提供了多个不同场景中的用例,帮助读者了解真实场景中技术工具的使用。 3.本书作者Anand Deshpande和Manish Kumar分别是Datametica Solutions的大数据交付总监和高级技术架构师,他们在数据生态系统技术和数据管理方面拥有丰富的经验。

售       价:¥

纸质售价:¥54.50购买纸书

40人正在读 | 0人评论 6.2

作       者:阿南德·德什潘德(Anand Deshpande) 著

出  版  社:人民邮电出版社有限公司

出版时间:2020-10-01

字       数:18.2万

所属分类: 科技 > 计算机/网络 > 软件系统

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书分为两个部分,共12章。第1章到第5章介绍了大数据的本体论、机器学习的基本理论等内容,为具体场景、算法的实践奠定了基础。读者可以了解到,在工程实践中,对大数据的处理、转化方式与人类学习知识并将其转化为实践的过程是多么相似。在对机器学习的介绍中,会对其数学原理、训练过程做基本的讲解,并辅以代码帮助读者了解真实场景中技术工具的使用。第6章到第12章提供了多个不同的用例,章节之间彼此独立,介绍了如何用人工智能技术(自然语言处理、模糊系统、遗传编程、群体智能、强化学习、网络安全、认知计算)实现大数据自动化解决方案。 如果读者对 Java 编程语言、分布式计算框架、各种机器学习算法有一定的了解,那么本书可以帮助你建立一个全局观,从更广阔的视角来看待人工智能技术在大数据中的应用。如果读者对上述知识一无所知,但是对大数据人工智能的技术、业务非常感兴趣,那么可以通过本书获得从零到一的认知提升。<br/>【推荐语】<br/>1.本书对大数据与人工智能有一个综述性的介绍,包括大数据的本体论、机器学习的基本理论等内容,为具体场景、算法的实践奠定了基础。。 2.同时也提供了多个不同场景中的用例,帮助读者了解真实场景中技术工具的使用。 3.本书作者Anand Deshpande和Manish Kumar分别是Datametica Solutions的大数据交付总监和高级技术架构师,他们在数据生态系统技术和数据管理方面拥有丰富的经验。 数据与人工智能是未来几十年的重要发展方向。随着人工智能的快速应用及普及,大数据不断累积,深度学习及强化学习等算法不断优化,大数据技术将与人工智能技术更紧密地结合,具备对数据的理解、分析、发现和决策能力。<br/>【作者】<br/>阿南德·德什潘德(Anand Deshpande)是Datametica Solutions公司的大数据交付主管。他负责与客户合作制订数据策略,并帮助他们的公司成为数据驱动型企业。他拥有丰富的大数据生态系统技术经验,经常在各种活动中就数据科学和大数据发表演讲,对数据科学、认知智能以及用于数据管理和分析的算法有着浓厚的兴趣。 马尼什·库马(Manish Kumar)是Datametica Solutions公司的高级技术架构师。作为一名数据、解决方案和产品架构师,他拥有超过11年的数据管理行业经验,经常就大数据和数据科学发表演讲。他在构建有效的ETL管道、通过Hadoop实现安全性、实现实时数据分析解决方案,以及为数据科学问题提供创新和的可能解决方案方面拥有丰富的经验。<br/>
目录展开

版 权

版权声明

内容提要

译者序

作者简介

审稿人简介

译者简介

前言

读者对象

主要内容

使用方法

排版约定

资源与支持

提交勘误

与我们联系

关于异步社区和异步图书

第1章 大数据与人工智能系统

1.1 结果金字塔

1.2 人脑最擅长什么

1.2.1 感官输入

1.2.2 存储

1.2.3 处理能力

1.2.4 低能耗

1.3 电子大脑最擅长什么

1.3.1 速度信息存储

1.3.2 蛮力处理

1.4 两全其美

1.4.1 大数据

1.4.2 从迟钝机器进化到智能机器

1.4.3 智能

1.智能的类型

2.智能任务的分类

1.4.4 大数据框架

1.批处理框架

2.实时处理框架

1.4.5 大数据智能应用

AI领域

1.5 常见问答

1.6 小结

第2章 大数据本体论

2.1 人脑与本体

2.2 信息科学本体论

2.2.1 本体的属性

2.2.2 本体的优点

2.2.3 本体的组成

2.2.4 本体在大数据中扮演的角色

2.2.5 本体对齐

2.2.6 本体在大数据中的目标

2.2.7 本体在大数据中的挑战

2.2.8 资源描述框架——通用数据格式

1.RDF容器

2.RDF类

3.RDF性质

4.RDF属性

2.2.9 使用Web本体语言:OWL

2.2.10 SPARQL查询语言

1.SPARQL的通用结构

2.SPARQL的其他特性

2.2.11 用本体构建智能机器

2.2.12 本体学习

本体学习过程

2.3 常见问答

2.4 小结

第3章 从大数据中学习

3.1 监督学习和无监督学习

3.2 Spark编程模型

3.3 Spark MLlib库

3.3.1 转换器函数

3.3.2 估计器算法

3.3.3 管道

3.4 回归分析

3.4.1 线性回归

最小二乘法

3.4.2 广义线性模型

3.4.3 对数几率回归分类技术

Spark的对数几率回归

3.4.4 多项式回归

3.4.5 逐步回归

1.正向选择

2.后向消元

3.4.6 岭回归

3.4.7 套索回归

3.5 数据聚类

3.6 K均值算法

Spark ML实现K均值

3.7 数据降维

3.8 奇异值分解

3.8.1 矩阵理论和线性代数概述

3.8.2 奇异值分解的重要性质

3.8.3 Spark ML实现SVD

3.9 主成分分析

3.9.1 用SVD实现PCA算法

3.9.2 用Spark ML实现SVD

3.10 基于内容的推荐系统

3.11 常见问答

3.12 小结

第4章 大数据神经网络

4.1 神经网络和人工神经网络的基础

4.2 感知器和线性模型

4.2.1 神经网络的组成符号

4.2.2 简单感知器模型的数学表示

4.2.3 激活函数

1.sigmoid函数

2.tanh函数

3.ReLu函数

4.3 非线性模型

4.4 前馈神经网络

4.5 梯度下降和反向传播

4.5.1 梯度下降伪代码

4.5.2 反向传播模型

4.6 过拟合

4.7 循环神经网络

4.7.1 RNN的需求

4.7.2 RNN的结构

4.7.3 训练RNN

4.8 常见问答

4.9 小结

第5章 深度大数据分析

5.1 深度学习基础知识和构建模块

5.1.1 基于梯度的学习

5.1.2 反向传播

5.1.3 非线性

5.1.4 剔除

5.2 构建数据准备管道

5.3 实现神经网络架构的实用方法

5.4 超参数调优

5.4.1 学习率

5.4.2 训练迭代的次数

5.4.3 隐藏单元数

5.4.4 时期数

5.4.5 用deeplearning4j试验超参数

5.5 分布式计算

5.6 分布式深度学习

5.6.1 DL4J和Spark

API概览

5.6.2 TensorFlow

5.6.3 Keras

5.7 常见问答

5.8 小结

第6章 自然语言处理

6.1 自然语言处理基础

6.2 文本预处理

6.2.1 删除停用词

6.2.2 词干提取

1.波特词干提取

2.雪球词干提取

3.兰卡斯特词干提取

4.洛文斯词干提取

5.道森词干提取

6.2.3 词形还原

6.2.4 N-Gram

6.3 特征提取

6.3.1 独热编码

6.3.2 TF-IDF

6.3.3 CountVectorizer

6.3.4 Word2Vec

1.CBOW模型

2.Skip-Gram模型

6.4 应用自然语言处理技术

文本分类

1.朴素贝叶斯算法

2.随机森林算法

3.朴素贝叶斯文本分类代码示例

6.5 实现情感分析

6.6 常见问答

6.7 小结

第7章 模糊系统

7.1 模糊逻辑基础

7.1.1 模糊集和隶属函数

7.1.2 明确集的属性和符号

1.在明确集上的运算

2.明确集的性质

7.1.3 模糊化

7.1.4 去模糊化

7.1.5 模糊推理

7.2 ANFIS网络

7.2.1 自适应网络

7.2.2 ANFIS架构和混合学习算法

7.3 模糊C均值聚类

7.4 模糊神经分类器

7.5 常见问答

7.6 小结

第8章 遗传编程

8.1 遗传算法的结构

8.2 KEEL框架

8.3 Encog机器学习框架

8.3.1 Encog开发环境设置

8.3.2 Encog API结构

8.4 Weka框架

Weka Explorer特性

1.预处理

2.分类

8.5 用Weka以遗传算法实现属性搜索

8.6 常见问答

8.7 小结

第9章 群体智能

9.1 什么是群体智能

9.1.1 自组织

9.1.2 主动共识

9.1.3 劳动分工

9.1.4 集体智能系统的优势

9.1.5 开发SI系统的设计原则

9.2 粒子群优化模型

实现PSO的注意事项

9.3 蚁群优化模型

9.4 MASON库

MASON分层架构

9.5 Opt4J库

9.6 在大数据分析中的应用

9.7 处理动态数据

9.8 多目标优化

9.9 常见问答

9.10 小结

第10章 强化学习

10.1 强化学习算法的概念

10.2 强化学习技术

10.2.1 马尔可夫决策过程

10.2.2 动态规划与强化学习

在具有策略迭代的确定性环境中学习

10.2.3 Q-learning

10.2.4 SARSA学习

10.3 深度强化学习

10.4 常见问答

10.5 小结

第11章 网络安全

11.1 大数据用于维生管线保护

11.1.1 数据收集与分析

11.1.2 异常检测

11.1.3 纠正和预防措施

11.1.4 概念上的数据流

1.Hadoop分布式文件系统

2.NoSQL数据库

3.MapReduce

4.Apache Pig

5.Apache Hive

11.2 理解流处理

11.2.1 流处理语义

11.2.2 Spark Streaming

11.2.3 Kafka

11.3 网络安全攻击类型

11.3.1 网络钓鱼

11.3.2 内网漫游

11.3.3 注入攻击

11.3.4 基于AI的防御

11.4 了解SIEM

可视化属性和特性

11.5 Splunk

11.5.1 Splunk Enterprise Security

11.5.2 Splunk Light

11.6 ArcSight ESM

11.7 常见问答

11.8 小结

第12章 认知计算

12.1 认知科学

12.2 认知系统

12.2.1 认知系统简史

12.2.2 认知系统的目标

12.2.3 认知系统的因素

12.3 认知智能在大数据分析中的应用

12.4 认知智能即服务

12.4.1 基于Watson的IBM认知工具包

12.4.2 基于Watson的认知应用

12.4.3 用Watson进行开发

1.设置先决条件

2.用Java开发语言翻译程序

12.5 常见问答

12.6 小结

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部