万本电子书0元读

万本电子书0元读

顶部广告

走进搜索引擎电子书

本书由搜索引擎开发研究领域三位年轻的博士生精心编写,作者们希望将自己对搜索引擎的理解和实际应用相结合,让未接触过搜索引擎原理和方法的读者也能轻松读懂该书的大部分内容。

售       价:¥

纸质售价:¥31.80购买纸书

331人正在读 | 0人评论 6.2

作       者:潘雪峰,花贵春,梁斌

出  版  社:电子工业出版社

出版时间:2011-05-01

字       数:17.9万

所属分类: 人文社科 > 社会科学 > 图书馆学/档案学

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(条)
  • 读书简介
  • 目录
  • 累计评论(条)
本书由搜索引擎发研究领域三位年轻的博士生精心编写,作者们希望将自己对搜索引擎的理解和实际应用相结合,让未触过搜索引擎原理和方法的读者也能轻松读懂该书的大部分内容。 本书在第1版的基础上,删除了搜索引擎历史等章节,并对错误和不足行了修订和补充,同时增加了潘雪峰编写的第6章“搜索引擎日志分析”,花贵春编写的第7章“排序学习(Learning to Rank)”和梁斌编写的第8章“搜索引擎的性能调优”三个主要章节,变更的内容约占第1版的一半。     读者对象:本书作为搜索引擎原理与技术的门书籍,面向那些有志从事搜索引擎行业的青年学生、需要完整理解并优化搜索引擎的专业技术人员、搜索引擎的营销人员,以及网站的负责人等。本书是从事搜索引擎发的工程技术人员难得的参考书,也可作为大中专院校相关专业的教学辅导书.<br/>
目录展开

作者序

关于本书作者

致谢

第1章 引言

1.1 搜索引擎概述

1.2 搜索引擎的主要需求

1.3 搜索引擎的4大系统

第2章 搜索引擎的下载系统

2.1 爬虫的发展历史

2.2 万维网及其网页分析

2.3 有关爬虫的基本概念

2.4 网页抓取原理

2.5 网页库

2.6 下载系统回顾及未来发展

参考文献

第3章 搜索引擎的分析系统

3.1 知识准备

3.2 信息抽取及网页信息结构化

3.3 网页查重

3.4 中文分词

3.5 PageRank

3.6 分析系统结构图

参考文献

第4章 搜索引擎的索引系统

4.1 知识准备

4.2 全文检索

4.3 文档编号

4.4 倒排索引

4.5 数据规模的估计

4.6 涉及存储规模的一些计算

4.7 倒排索引文件的创建过程

参考文献

第5章 搜索引擎的查询系统

5.1 知识准备

5.2 网页信息检索

5.3 中文自动摘要

5.4 生成搜索结果页

5.5 搜索结果页的缓存

5.6 推测用户查询意图

5.7 查询系统的当前热点和发展方向

参考文献

第6章 搜索引擎日志分析

6.1 简介

6.2 知识准备

6.3 查询日志分析

6.4 点击日志分析

6.5 隐私问题

6.6 本章总结

参考文献

第7章 排序学习(Learning to Rank)

7.1 排序概述

7.2 传统的排序模型

7.3 排序学习简介以及研究现状

7.4 排序学习模型的应用实例

7.5 排序学习方法的框架

7.6 评测数据集

7.7 排序学习模型简介

7.8 排序学习模型性能比较

7.9 排序学习的研究方向

7.10 总结

参考文献

第8章 搜索引擎的性能调优

8.1 系统调优概述

8.2 瓶颈识别

8.3 涉及CPU的优化方法

8.4 涉及内存的优化方法

8.5 涉及磁盘的优化方法

8.6 涉及网络的优化方法

参考文献

累计评论(条) 个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部