万本电子书0元读

万本电子书0元读

顶部广告

深入理解ElasticSearch电子书 租阅

售       价:¥

纸质售价:¥54.50购买纸书

163人正在读 | 0人评论 6.2

作       者:(美)酷奇(Kuc,R.),(美)罗戈任斯基(Rogozinski,M.)

出  版  社:机械工业出版社

出版时间:2016-01-01

字       数:17.7万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:此类商品不支持退换货,不支持下载打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(2条)
  • 读书简介
  • 目录
  • 累计评论(2条)
第1章介绍ApacheLucene的工作方式、ElasticSearch的基本概念。第2章描述Lucene评分机制、如何进行查询重写,另外还介绍ElasticSearch的批处理API及如何使用过滤器来优化查询。第3章描述如何修改Lucene评分,如何使用不同的倒排索引格式来改变索引字段的结构。第4章阐述如何选择恰当的索引分片、路由工作机制、索引分片机制。第5章介绍如何为具体应用选择正确的目录实现,同时阐述发现、网关、恢复模块及其配置方式,以及调优ElasticSearch的缓存机制。第6章介绍JVM垃圾收集的工作原理、重要性以及如何调优,还介绍如何控制ElasticSearch的I/O操作数量和如何诊断ElasticSearch中的问题。第7章介绍帮助修正查询中的拼写错误以及构建高效的自动完成机制——查询建议,还通过实际的案例展示如何通过使用不同查询类型和ElasticSearch的其他功能来提高查询相关性。第8章重点阐释ElasticSearch的JAVAAPI。第9章通过演示如何开发你自己的河流和语言处理插件来介绍ElasticSearch的插件开发。 第1章介绍ApacheLucene的工作方式、ElasticSearch的基本概念。第2章描述Lucene评分机制、如何行查询重写,另外还介绍ElasticSearch的批处理API及如何使用过滤器来优化查询。第3章描述如何修改Lucene评分,如何使用不同的倒排索引格式来改变索引字段的结构。第4章阐述如何选择恰当的索引分片、路由工作机制、索引分片机制。第5章介绍如何为具体应用选择正确的目录实现,同时阐述发现、网关、恢复模块及其配置方式,以及调优ElasticSearch的缓存机制。第6章介绍JVM垃圾收集的工作原理、重要性以及如何调优,还介绍如何控制ElasticSearch的I/O操作数量和如何诊断ElasticSearch中的问题。第7章介绍帮助修正查询中的拼写错误以及构建高效的自动完成机制——查询建议,还通过实际的案例展示如何通过使用不同查询类型和ElasticSearch的其他功能来提高查询相关性。第8章重阐释ElasticSearch的JAVAAPI。第9章通过演示如何发你自己的河流和语言处理插件来介绍ElasticSearch的插件发。
【作者】
About the Authors 作 者 简 介Rafa Ku是一个很有天资的团队领袖及软件发人员,现任Sematext集团公司的咨询专家及软件工程师,专注于源技术,如Apache Lucene、Solr、ElasticSearch和Hadoop stack等,拥有超过11年的软件研发经验,涉及领域广阔,从银行软件到电子商务产品。他主要侧重于Java平台,但对能提高研发效率的任何其他工具或编程语言都抱有极高的热情。同时他也是solr.pl网站的创始人之一,该网站致力于帮助人们解决Solr和Lucene的相关问题。他还是世界范围内各种会议热邀的演讲嘉宾,曾受邀出席过Lucene Eurocon、Berlin Buzzwords、ApacheCon、Lucene Revolution等会议。 Rafa*早于2002年触Lucene,一始他并不喜欢这个源产品,然而在2003年再次使用Lucene时,他改变了自己的看法,并看到了搜索技术的巨大潜力,随后Solr诞生了。Rafa于2010年始使用ElasticSearch,目前主要关注Lucene、Solr、ElasticSearch和信息检索等方面。 Rafa是《Solr 3.1 Cookbook》一书及其后续版本《Solr 4.0 Cookbook》的作者,同时也是Packt Publishing出版的所有版本的《ElasticSearch Server》的合著者之一。 Marek Rogoziński是一个有着10多年经验的软件架构师和咨询师,专注基于源搜索引擎(如Solr、ElasticSearch等)的解决方案和大数据分析技术(Hadoop、HBase、Twitter Storm等)。 他是solr.pl网站的联合创始人之一,该网站致力于提供Solr和Lucene的相关资讯,同时他也是Packt Publishing出版的《ElasticSearch Server》的作者之一。 Marek Rogoziński还是一家提供流式大数据处理和分析产品的公司的CTO。
目录展开

译者序

前言

致谢

作者简介

评审者简介

第1章 ElasticSearch简介

1.1 Apache Lucene简介

1.1.1 熟悉Lucene

1.1.2 Lucene的总体架构

1.1.3 分析你的数据

1.1.4 Lucene查询语言

1.2 ElasticSearch简介

1.2.1 ElasticSearch的基本概念

1.2.2 ElasticSearch架构背后的关键概念

1.2.3 ElasticSearch的工作流程

1.3 小结

第2章 查询DSL进阶

2.1 Apache Lucene默认评分公式解释

2.1.1 何时文档被匹配上

2.1.2 TF/IDF评分公式

2.1.3 ElasticSearch如何看评分

2.2 查询改写

2.2.1 前缀查询范例

2.2.2 回顾Apache Lucene

2.2.3 查询改写的属性

2.3 二次评分

2.3.1 理解二次评分

2.3.2 范例数据

2.3.3 查询

2.3.4 二次评分查询的结构

2.3.5 二次评分参数配置

2.3.6 小结

2.4 批量操作

2.4.1 批量取

2.4.2 批量查询

2.5 排序

2.5.1 基于多值字段的排序

2.5.2 基于多值geo字段的排序

2.5.3 基于嵌套对象的排序

2.6 数据更新API

2.6.1 简单字段更新

2.6.2 使用脚本按条件更新

2.6.3 使用更新API创建或删除文档

2.7 使用过滤器优化查询

2.7.1 过滤器与缓存

2.7.2 词项查找过滤器

2.8 ElasticSearch切面机制中的过滤器与作用域

2.8.1 范例数据

2.8.2 切面计算和过滤

2.8.3 过滤器作为查询的一部分

2.8.4 切面过滤器

2.8.5 全局作用域

2.9 小结

第3章 底层索引控制

3.1 改变Apache Lucene的评分方式

3.1.1 可用的相似度模型

3.1.2 为每字段配置相似度模型

3.2 相似度模型配置

3.2.1 选择默认的相似度模型

3.2.2 配置被选用的相似度模型

3.3 使用编解码器

3.3.1 简单使用范例

3.3.2 工作原理解释

3.3.3 可用的倒排表格式

3.3.4 配置编解码器

3.4 准实时、提交、更新及事务日志

3.4.1 索引更新及更新提交

3.4.2 事务日志

3.4.3 准实时读取

3.5 深入理解数据处理

3.5.1 输入并不总是进行文本分析

3.5.2 范例的使用

3.5.3 索引期更换分词器

3.5.4 搜索时更换分析器

3.5.5 陷阱与默认分析

3.6 控制索引合并

3.6.1 选择正确的合并策略

3.6.2 合并策略配置

3.6.3 调度

3.7 小结

第4章 分布式索引架构

4.1 选择合适的分片和副本数

4.1.1 分片和过度分配

4.1.2 一个过度分配的正面例子

4.1.3 多分片与多索引

4.1.4 副本

4.2 路由

4.2.1 分片和数据

4.2.2 测试路由功能

4.2.3 索引时使用路由

4.2.4 别名

4.2.5 多个路由值

4.3 调整默认的分片分配行为

4.3.1 分片分配器简介

4.3.2 even_shard分片分配器

4.3.3 balanced分片分配器

4.3.4 自定义分片分配器

4.3.5 裁决者

4.4 调整分片分配

4.4.1 部署意识

4.4.2 过滤

4.4.3 运行时更新分配策略

4.4.4 确定每个节点允许的总分片数

4.4.5 更多的分片分配属性

4.5 查询执行偏好

4.6 应用我们的知识

4.6.1 基本假定

4.6.2 配置

4.6.3 变化来了

4.7 小结

第5章 管理ElasticSearch

5.1 选择正确的目录实现-存储模块

5.2 发现模块的配置

5.2.1 Zen发现

5.2.2 亚马逊EC2发现

5.2.3 本地网关

5.2.4 恢复配置

5.3 索引段统计

5.3.1 segments API简介

5.3.2 索引段信息的可视化

5.4 理解ElasticSearch缓存

5.4.1 过滤器缓存

5.4.2 字段数据缓存

5.4.3 清除缓存

5.5 小结

第6章 故障处理

6.1 了解垃圾回收器

6.1.1 Java内存

6.1.2 处理垃圾回收问题

6.1.3 在类UNIX系统中避免内存交换

6.2 关于I/O调节

6.2.1 控制IO节流

6.2.2 配置

6.3 用预热器提升查询速度

6.3.1 为什么使用预热器

6.3.2 操作预热器

6.3.3 测试预热器

6.4 热点线程

6.4.1 澄清热点线程API的用法误区

6.4.2 热点线程API的响应信息

6.5 现实场景

6.5.1 越来越差的性能

6.5.2 混杂的环境和负载不平衡

6.5.3 我的服务器出故障了

6.6 小结

第7章 改善用户搜索体验

7.1 改正用户拼写错误

7.1.1 测试数据

7.1.2 深入技术细节

7.1.3 completion suggester

7.2 改善查询相关性

7.2.1 数据

7.2.2 改善相关性的探索之旅

7.3 小结

第8章 ElasticSearch Java API

8.1 ElasticSearch Java API简介

8.2 代码

8.3 连接到集群

8.3.1 成为ElasticSearch节点

8.3.2 使用传输机连接方式

8.3.3 选择合适的连接方式

8.4 API剖析

8.5 CRUD操作

8.5.1 读取文档

8.5.2 索引文档

8.5.3 更新文档

8.5.4 删除文档

8.6 ElasticSearch查询

8.6.1 准备查询请求

8.6.2 构造查询

8.6.3 分页

8.6.4 排序

8.6.5 过滤

8.6.6 切面计算

8.6.7 高亮

8.6.8 查询建议

8.6.9 计数

8.6.10 滚动

8.7 批量执行多个操作

8.7.1 批量操作

8.7.2 根据查询删除文档

8.7.3 Multi GET

8.7.4 Multi Search

8.8 Percolator

8.9 explain API

8.10 构造JSON格式的查询和文档

8.11 管理API

8.11.1 集群管理API

8.11.2 索引管理API

8.12 小结

第9章 开发ElasticSearch插件

9.1 建立Apache Maven项目结构

9.1.1 了解基本知识

9.1.2 Maven Java项目的结构

9.1.3 POM的理念

9.1.4 运行构建过程

9.1.5 引入Maven装配插件

9.2 创建一个自定义river插件

9.2.1 实现细节

9.2.2 测试river

9.3 创建自定义分析插件

9.3.1 实现细节

9.3.2 测试自定义分析插件

9.4 小结

累计评论(2条) 3个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部