为你推荐
作者序
关于本书作者
致谢
第1章 引言
1.1 搜索引擎概述
1.2 搜索引擎的主要需求
1.3 搜索引擎的4大系统
第2章 搜索引擎的下载系统
2.1 爬虫的发展历史
2.2 万维网及其网页分析
2.3 有关爬虫的基本概念
2.4 网页抓取原理
2.5 网页库
2.6 下载系统回顾及未来发展
参考文献
第3章 搜索引擎的分析系统
3.1 知识准备
3.2 信息抽取及网页信息结构化
3.3 网页查重
3.4 中文分词
3.5 PageRank
3.6 分析系统结构图
参考文献
第4章 搜索引擎的索引系统
4.1 知识准备
4.2 全文检索
4.3 文档编号
4.4 倒排索引
4.5 数据规模的估计
4.6 涉及存储规模的一些计算
4.7 倒排索引文件的创建过程
参考文献
第5章 搜索引擎的查询系统
5.1 知识准备
5.2 网页信息检索
5.3 中文自动摘要
5.4 生成搜索结果页
5.5 搜索结果页的缓存
5.6 推测用户查询意图
5.7 查询系统的当前热点和发展方向
参考文献
第6章 搜索引擎日志分析
6.1 简介
6.2 知识准备
6.3 查询日志分析
6.4 点击日志分析
6.5 隐私问题
6.6 本章总结
参考文献
第7章 排序学习(Learning to Rank)
7.1 排序概述
7.2 传统的排序模型
7.3 排序学习简介以及研究现状
7.4 排序学习模型的应用实例
7.5 排序学习方法的框架
7.6 评测数据集
7.7 排序学习模型简介
7.8 排序学习模型性能比较
7.9 排序学习的研究方向
7.10 总结
参考文献
第8章 搜索引擎的性能调优
8.1 系统调优概述
8.2 瓶颈识别
8.3 涉及CPU的优化方法
8.4 涉及内存的优化方法
8.5 涉及磁盘的优化方法
8.6 涉及网络的优化方法
参考文献
买过这本书的人还买过
读了这本书的人还在读
同类图书排行榜