万本电子书0元读

万本电子书0元读

顶部广告

大数据架构和算法实现之路:电商系统的技术实战电子书

售       价:¥

纸质售价:¥54.50购买纸书

4人正在读 | 0人评论 6.4

作       者:黄申

出  版  社:机械工业出版社

出版时间:2017-06-01

字       数:46.6万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(2条)
  • 读书简介
  • 目录
  • 累计评论(2条)
本书介绍了一些主流技术在商业项目中的应用,包括机器学习中的分类、聚类和线性回归,搜索引擎,推荐系统,用户行为跟踪,架构设计的基本理念及常用的消息和缓存机制。在这个过程中,我们有机会实践R、Mahout、Solr、Elasticsearch、Hadoop、HBase、Hive、Flume、Kafka、Storm等系统。本书大的特色就是,从商业需求出发演变到合理的技术方案和实现,因此根据不同的应用场景、不同的数据集合、不同的阶难度,我们为读者提供了反复温习和加深印象的机会。<br/>【作者】<br/>机器学习和大数据挖掘领域的技术专家和管理者。在上海交通大学获得计算机科学与工程博士学位,先后在微软亚洲研究院,eBay中国研发中心,1号店和飞牛网工作。“微软学者奖”获得者,IBM中国首届“ExtremeBlue天才孵化计划”成员。有超过10年的学术创新和实际研发的经验,成功孵化了10多项关键算法,发表了20多篇国际学术论文,拥有10多项国际专利及申请。目前是《计算机工程》杂志的特邀审稿专家,参与撰写的互联网图书《玩转电商》已经于2014年出版。<br/>
目录展开

推荐序

前言

引子

第一篇 支持高效的运营

第1章 方案设计和技术选型:分类

1.1 分类的基本概念

1.2 分类任务的处理流程

1.3 算法:朴素贝叶斯和K最近邻

1.4 分类效果评估

1.5 相关软件:R和Mahout

1.6 案例实践

1.7 更多的思考

第2章 方案设计和技术选型:聚类

2.1 聚类的基本概念

2.2 算法:K均值和层次型聚类

2.3 聚类的效果评估

2.4 案例实践

第3章 方案设计和技术选型:因变量连续的回归分析

3.1 线性回归的基本概念

3.2 案例实践

第二篇 为顾客发现喜欢的商品:基础篇

第4章 方案设计和技术选型:搜索

4.1 搜索引擎的基本概念

4.2 搜索引擎的评估

4.3 为什么不是数据库

4.4 系统框架

4.5 常见的搜索引擎实现

4.6 案例实践

第三篇 为顾客发现喜欢的商品:高级篇

第5章 方案设计和技术选型:NoSQL和搜索的整合

5.1 问题分析

5.2 HBase简介

5.3 结合HBase和搜索引擎

5.4 案例实践

第6章 方案设计和技术选型:查询分类和搜索的整合

6.1 问题分析

6.2 结合分类器和搜索引擎

6.3 案例实践

第7章 方案设计和技术选型:个性化搜索

7.1 问题分析

7.2 结合用户画像和搜索引擎

7.3 案例实践

第8章 方案设计和技术选型:搜索分片

8.1 问题分析

8.2 利用搜索的分片机制

8.3 案例实践

第9章 方案设计和技术选型:搜索提示

9.1 问题分析

9.2 案例实践:基础方案

9.3 改进方案

9.4 案例实践:改进方案

第10章 方案设计和技术选型:推荐

10.1 推荐系统的基本概念

10.2 推荐的核心要素

10.3 推荐系统的分类

10.4 混合模型

10.5 系统架构

10.6 Mahout中的推荐算法

10.7 电商常见的推荐系统方案

10.8 案例实践

第四篇 获取数据,跟踪效果

第11章 方案设计和技术选型:行为跟踪

11.1 基本概念

11.2 使用谷歌分析

11.3 自行设计之Flume、HDFS和Hive的整合

11.4 自行设计之Flume、Kafka和Storm的整合

11.5 案例实践

11.6 更多的思考

后记

累计评论(2条) 2个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部