万本电子书0元读

万本电子书0元读

顶部广告

深度学习搜索引擎开发:Java实现电子书

1.本书教你用深度学习和神经网络造更智能的搜索引擎,通过简单易懂的示例解释搜索和深度学习技术,大部分示例配有Java代码。 2.书中介绍了搜索引擎面临的主要挑战及其常见解决方法,以及深度学习所能提供的帮助。 3.此外还阐释了几种深度学习技术及其在搜索环境中的适用范围,以及Lucene和Deeplearning4j库的用法。 4.*后讨论了更为复杂的应用场景,例如由深度学习驱动的机器翻译和图像搜索。

售       价:¥

纸质售价:¥58.80购买纸书

87人正在读 | 1人评论 6.2

作       者:[意]托马索·泰奥菲利(Tommaso Teofili)

出  版  社:人民邮电出版社有限公司

出版时间:2020-10-01

字       数:26.8万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书是市面上少见的将搜索与深度学习相结合的书,讨论了使用(深度)神经网络来帮助建立有效的搜索引擎的方法。阅读本书无须具备发搜索引擎的背景,也不需要具备有关机器学习或深度学习的预备知识,因为本书将介绍所有相关的基础知识和实用技巧。书中研究了搜索引擎的几个组成部分,不仅针对它们的工作方式提供了一些见解,还为在不同环境中使用神经网络提供了指导。读完本书,你将深理解搜索引擎面临的主要挑战、这些挑战的常见解决方法以及深度学习所能提供的帮助。你将清晰地理解几种深度学习技术以及它们在搜索环境中的适用范围,并深了解Lucene和Deeplearning4j库。书中示例代码用Java编写。<br/>【推荐语】<br/>1.本书教你用深度学习和神经网络造更智能的搜索引擎,通过简单易懂的示例解释搜索和深度学习技术,大部分示例配有Java代码。 2.书中介绍了搜索引擎面临的主要挑战及其常见解决方法,以及深度学习所能提供的帮助。 3.此外还阐释了几种深度学习技术及其在搜索环境中的适用范围,以及Lucene和Deeplearning4j库的用法。 4.*后讨论了更为复杂的应用场景,例如由深度学习驱动的机器翻译和图像搜索。 5.提供源代码、本书部分彩图下载。 本书读者应具备一定的Java编程基础,但不需要具备深度学习和搜索引擎发背景。 ● *部分:搜索、机器学习和深度学习的基本概念;使用神经网络模型从数据中生成同义词 ● 第二部分:使用循环神经网络来生成用户输查询的替代查询;借助深度神经网络的帮助,在用户输查询时提供更好的建议;使用词嵌提供相关性更强的搜索结果;文档嵌在排序函数和内容推荐中的使用 ● 第三部分:由深度学习驱动的机器翻译和图像搜索;深度学习模型调优和处理连续传的数据流<br/>【作者】<br/>托马索·泰奥菲利(Tommaso Teofili) Red Hat公司高级软件工程师,曾担任Adobe公司软件工程师,对源和人工智能充满热情。他是Apache软件基金会的成员,参与了许多项目,涉及信息检索、自然语言处理和分布式计算等主题。 【译者简介】 李军 电子科技大学计算机应用技术硕士,《IDA Pro代码破解揭密》合作译者,现从事电力系统自动化工作。 天舒 曾就读于四川大学电气工程及自动化专业,英国曼彻斯特大学电力系统工程硕士,现从事电力系统自动化工作。<br/>
目录展开

版权声明

献词

译者序

前言

致谢

关于本书

目标读者

阅读路线图

代码约定

liveBook论坛

电子书

关于封面图

第一部分 当搜索遇上深度学习

第 1 章 神经搜索

1.1 神经网络及深度学习

1.2 什么是机器学习

1.3 深度学习能为搜索做什么

1.4 学习深度学习的路线图

1.5 检索有用的信息

1.5.1 文本、词素、词项和搜索基础

1.5.2 相关性优先

1.5.3 经典检索模型

1.5.4 精确率与召回率

1.6 未解决的问题

1.7 打开搜索引擎的黑盒子

1.8 利用深度学习解决问题

1.9 索引与神经元

1.10 神经网络训练

1.11 神经搜索的前景

1.12 总结

第 2 章 生成同义词

2.1 同义词扩展介绍

2.1.1 为什么要使用同义词

2.1.2 基于词汇表的同义词匹配

2.2 语境的重要性

2.3 前馈神经网络

2.3.1 前馈神经网络如何工作:权重和激活函数

2.3.2 简述反向传播

2.4 使用word2vec

2.4.1 在Deeplearning4j中设置word2vec

2.4.2 基于word2vec的同义词扩展

2.5 评价和比较

2.6 用于生产系统时的考虑

同义词与反义词

2.7 总结

第二部分 将神经网络用于搜索引擎

第 3 章 从纯检索到文本生成

3.1 信息需求与查询:弥补差距

3.1.1 生成可选查询

3.1.2 数据准备

3.1.3 生成数据的小结

3.2 学习序列

3.3 循环神经网络

3.3.1 循环神经网络内部结构和动态

3.3.2 长期依赖

3.3.3 LSTM网络

3.4 用于无监督文本生成的LSTM网络

无监督查询扩展

3.5 从无监督文本生成到监督文本生成

序列到序列建模

3.6 生产系统的考虑因素

3.7 总结

第 4 章 更灵敏的查询建议

4.1 生成查询建议

4.1.1 编写查询时的建议

4.1.2 基于字典的建议算法

4.2 Lucene Lookup API

4.3 分析后的建议算法

4.4 使用语言模型

4.5 基于内容的建议算法

4.6 神经语言模型

4.7 基于字符的神经语言建议模型

4.8 调优LSTM语言模型

4.9 使用词嵌入使建议多样化

4.10 总结

第 5 章 用词嵌入对搜索结果排序

5.1 排序的重要性

5.2 检索模型

5.2.1 TF-IDF与向量空间模型

5.2.2 在Lucene中对文档进行排序

5.2.3 概率模型

5.3 神经信息检索

5.4 从单词到文档向量

5.5 评价和比较

基于平均词嵌入的相似度

5.6 总结

第 6 章 用于排序和推荐的文档嵌入

6.1 从词嵌入到文档嵌入

6.2 在排序中使用段向量

基于段向量的相似度

6.3 文档嵌入及相关内容

6.3.1 搜索、推荐和相关内容

6.3.2 使用高频词项查找相似内容

6.3.3 使用段向量检索相似内容

6.3.4 从编码器-解码器模型用向量检索相似内容

6.4 总结

第三部分 延伸

第 7 章 跨语言搜索

7.1 为讲多种语言的用户提供服务

7.1.1 翻译文档与查询

7.1.2 跨语言搜索

7.1.3 在Lucene上进行多语言查询

7.2 统计机器翻译

7.2.1 对齐

7.2.2 基于短语的翻译

7.3 使用并行语料库

7.4 神经机器翻译

7.4.1 编码器-解码器模型

7.4.2 DL4J中用于机器翻译的编码器-解码器

7.5 多语言的单词和文档嵌入

线性投影单语言嵌入

7.6 总结

第 8 章 基于内容的图像搜索

8.1 图像内容和搜索

8.2 回顾:基于文本的图像检索

8.3 理解图像

8.3.1 图像表示

8.3.2 特征提取

8.4 图像表示的深度学习

8.4.1 卷积神经网络

8.4.2 图像搜索

8.4.3 局部敏感散列

8.5 处理未标记的图像

8.6 总结

第 9 章 性能一瞥

9.1 深度学习的性能与约定

从模型设计到生产

9.2 索引和神经元协同工作

9.3 使用数据流

9.4 总结

展望未来

作者简介

看完了

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部