万本电子书0元读

万本电子书0元读

顶部广告

大数据架构商业之路:从业务需求到技术方案电子书

作者荣获美国政府颁发的“美国杰出人才”称号。大润发中国区董事长、飞牛网首席执行董事黄明端先生与eBay全球零售科学高级总监逄伟先生作序力荐!   将技术与商业需求相结合,深剖析大数据商业应用中的困惑与难题,帮助读者更好地掌握技术支撑业务高速发展的方案!

售       价:¥

纸质售价:¥51.70购买纸书

15人正在读 | 0人评论 6.8

作       者:黄申

出  版  社:机械工业出版社

出版时间:2016-04-01

字       数:25.5万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
目前大数据技术已经日趋成熟,但是业界发现与大数据相关的产品设计和研发仍然非常困难,技术、产品和商业的结合度还远远不够。这主要是因为大数据涉及范围 广、技术含量高、更新换代快,门槛也比其他大多数IT行业更高。人们要么使用昂贵的商业解决方案,要么花费巨大的精力摸索。本书通过一个虚拟的互联网 O2O创业故事,来逐步展介绍创业各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析;让读者身临其境,一起来探寻大数据 的奥秘。书中会覆盖较广泛的技术,并提供相应的背景知识介绍,对于想一步深研究细节的读者,也可轻松获得继续阅读的方向和指导性建议。<br/>【推荐语】<br/>作者荣获美国政府颁发的“美国杰出人才”称号。大润发中国区董事长、飞牛网首席执行董事黄明端先生与eBay全球零售科学高级总监逄伟先生作序力荐! 将技术与商业需求相结合,深剖析大数据商业应用中的困惑与难题,帮助读者更好地掌握技术支撑业务高速发展的方案!<br/>【作者】<br/>黄申,博士,毕业于上海交通大学计算机科学与工程专业,师从俞勇教授。微软学者,IBMExtremeBlue天才计划成员。长期专注于大数据相关的搜 索、推荐、广告以及用户精准化领域。曾在微软亚洲研究院、eBay中国、沃尔玛1号店和大润发飞牛网担任要职,带队完成了若干公司级的战略项目。同时著有 20多篇国际论文和10多项国际专利,兼任《计算机工程》期刊特邀审稿专家。因其对业界的卓越贡献,2015年获得美国政府颁发的“美国杰出人才”称号。<br/>
目录展开

推荐序一

推荐序二

前言

第1章 抉择

第2章 数据收集

2.1 互联网数据收集

2.1.1 网络爬虫

2.1.2 Apache Nutch简介

2.1.3 Heritrix简介

2.2 内部数据收集

2.2.1 Apache Flume简介

2.2.2 Facebook Scribe和Logstash

2.3 本章心得

2.4 参考资料

第3章 数据存储

3.1 持久化存储

3.1.1 Hadoop和HDFS

3.1.2 HBase简介

3.1.3 MongoDB

3.2 非持久化存储

3.2.1 缓存和散列

3.2.2 Memcached和Berkeley DB简介

3.2.3 Redis简介

3.3 本章心得

3.4 参考资料

第4章 数据处理

4.1 离线批量处理

4.1.1 Hadoop的MapReduce

4.1.2 Spark简介

4.1.3 Hive简介

4.1.4 Pig、Impala和Spark SQL

4.2 提升及时性:消息机制

4.2.1 ActiveMQ简介

4.2.2 Kafka简介

4.3 在线实时处理

4.3.1 Storm简介

4.3.2 Spark Streaming简介

4.4 本章心得

4.5 参考资料

第5章 信息检索

5.1 基本理念

5.2 相关性

5.2.1 布尔模型

5.2.2 基于排序的布尔模型

5.2.3 向量空间模型

5.2.4 语言模型

5.3 及时性

5.4 与数据库查询的对比

5.5 搜索引擎

5.5.1 Web搜索中的链接分析

5.5.2 电子商务中的商品排序

5.5.3 多因素和基于学习的排序

5.5.4 系统框架

5.5.5 Lucene简介

5.5.6 Solr简介

5.5.7 Elasticsearch简介

5.6 推荐系统

5.6.1 推荐的核心要素

5.6.2 推荐系统的分类

5.6.3 混合模型

5.6.4 系统架构

5.6.5 Mahout

5.7 在线广告

5.7.1 在线广告的类型

5.7.2 广告投放机制

5.7.3 广告的拍卖机制

5.7.4 广告系统架构

5.8 本章心得

5.9 参考资料

第6章 数据挖掘

6.1 基本理念

6.2 数据的表示和预处理

6.2.1 数据的表示

6.2.2 数据的预处理

6.3 机器学习算法

6.3.1 监督学习——分类

6.3.2 监督学习——回归

6.3.3 非监督学习——聚类

6.4 挖掘工具

6.4.1 Mahout简介

6.4.2 R简介

6.5 本章心得

6.6 参考资料

第7章 效能评估

7.1 效果评估

7.1.1 离线评估

7.1.2 非离线的评估

7.2 性能评估

7.2.1 计算复杂度

7.2.2 应用系统性能

7.2.3 JMeter工具

7.3 本章心得

7.4 参考资料

第8章 大数据技术全景

第9章 商品太多啦!需要搜索引擎

9.1 业务需求

9.2 产品设计和技术选型

9.3 实现方案

9.3.1 数据定义和配置

9.3.2 集群搭建

9.3.3 DIH配置

第10章 能否更主动?还需要推荐引擎

10.1 业务需求

10.2 产品设计和技术选型

10.3 实现方案

10.3.1 基于内容特征的衡量

10.3.2 基于行为特征的衡量

10.3.3 提供在线服务

第11章 这样做的效果如何

11.1 业务需求

11.2 产品设计和技术选型

11.3 实现方案

11.3.1 行为数据的定义和记录

11.3.2 Flume和HDFS的集成

11.3.3 通过Hive进行分析

11.3.4 Kafka和Storm的集成

第12章 这个搜索有点逊

12.1 业务需求:还要搜得更多

12.2 “还要搜得更多”:产品设计和技术选型

12.3 “还要搜得更多”的方案实现

12.3.1 HBase的部署

12.3.2 HBase和Solr的集成

12.4 业务需求:还要搜得更准

12.5 “还要搜得更准”:产品设计和技术选型

12.5.1 提升搜索排序的相关性

12.5.2 提升搜索排序的整体效果

12.6 “还要搜得更准”的方案实现

12.7 业务需求:还要更快

12.8 还要“变”得更快:产品设计和技术选型

12.9 还要“搜”得更快:产品设计和技术选型

12.10 业务需求:给点提示吧

12.11 给点提示吧:产品设计和技术选型

第13章 支持更高效的运营

13.1 业务需求:互联网时代的CRM

13.2 互联网时代的CRM:产品设计和技术选型

13.3 业务需求:抓住捣蛋鬼

13.4 抓住捣蛋鬼:产品设计和技术选型

13.4.1 识别分类错放

13.4.2 识别SEO作弊

13.5 业务需求:销售之战

13.6 销售之战:产品设计和技术选型

13.6.1 设置合理的价格

13.6.2 识别黄牛

后记

累计评论(0条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部