万本电子书0元读

万本电子书0元读

顶部广告

算法与数据中台:基于Google、Facebook与微博实践电子书

√ 作者在业务智能化代表企业谷歌脸书微博有完整架构搭建实用化数据中台与超大规模机器学习中台的丰富经验。 √ FacebookGoogleUber贝尔实验室SHAREit阿里腾讯网易滴滴好未来快手商汤领域技术负责人集体盛赞。 √ 智能数据中台解决方案全景解析:大数据的线下offline处理近线near-line半实时模型更新在线online实时服务。 √ 全覆盖中台技术基础设施、在线算法服务、机器学习平台、分布式数据库系统、大数据平台的精华知识与案例。

售       价:¥

纸质售价:¥66.70购买纸书

279人正在读 | 0人评论 6.2

作       者:詹盈

出  版  社:电子工业出版社

出版时间:2020-08-01

字       数:21.8万

所属分类: 科技 > 计算机/网络 > 程序设计

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书作者依据在Google、Facebook、新浪微博及滴滴出行等中美一流互联网公司的实际工作经历,对算法技术、数据技术,以及围绕它们行的技术中台建设实践行了全面的探讨,并在此基础上对信息流推荐、计算广告及智能出行等核心互联网业务行了案例剖析。本书具有广阔的技术视野,内容颇具深度,既适合互联网行业的技术从业者阅读,也适合计算机相关专业的高年级本科生、研究生阅读。通过阅读本书,读者能加深对机器学习、深度学习、大数据、分布式系统及技术中台等相关领域的认知与理解,并从中获得一定的启发和可借鉴的经验。<br/>【推荐语】<br/>√ 作者在业务智能化代表企业谷歌脸书微博有完整架构搭建实用化数据中台与超大规模机器学习中台的丰富经验。 √ FacebookGoogleUber贝尔实验室SHAREit阿里腾讯网易滴滴好未来快手商汤领域技术负责人集体盛赞。 √ 智能数据中台解决方案全景解析:大数据的线下offline处理近线near-line半实时模型更新在线online实时服务。 √ 全覆盖中台技术基础设施、在线算法服务、机器学习平台、分布式数据库系统、大数据平台的精华知识与案例。<br/>【作者】<br/>詹盈,本科毕业于南京大学,后赴美攻读计算机博士学位。先后就职于 Google、Facebook 以及新浪微博,历任主任架构师、算法总监等职位。长期致力于机器学习算法、算法工程平台和大规模个性化系统等方向的技术研究以及团队管理工作,对推荐系统、计算广告、大数据和云计算等相关业务领域有着长期深的工作经验和成功实践。 郑旭飞,先后就职于 360 搜索、滴滴出行以及新浪微博,历任算法专家和资深工程师等职位,对搜索、推荐、广告等个性化系统以及机器学习平台有着丰富的实践经验。 刘畅宇,美国哥伦比亚大学计算机硕士学位,先后就职于彭博社和新浪微博并担任资深架构师等职位,对金融交易系统、计算广告平台以及大规模分布式系统有着深刻理解和成功经验。  郝忠秀,新浪微博广告基础架构负责人,对大规模分布式系统、海量数据存储系统、大数据平台以及计算广告等相关领域有着长期工作经验和诸多成功实践。<br/>
目录展开

前折页

内容简介

推荐语(按姓氏笔画排序)

推荐序

前言

第1章 算法与数据中台概述

1.1 中台的背景和意义

1.2 算法与数据中台的功能价值

1.3 算法与数据中台的技术体系

1.4 算法与数据中台的实践场景

1.5 算法与数据中台的应用前景

1.6 本章总结

第2章 中台技术之基础设施

2.1 研发效率系统

2.1.1 代码组织和构建

2.1.2 代码审查和任务管理

2.1.3 持续集成

2.1.4 通用压测平台

2.2 服务通信系统

2.2.1 跨进程通信框架

2.2.2 服务注册与发现

2.2.3 服务治理

2.3 监控报警系统

2.3.1 通用系统架构

2.3.2 指标计算模型

2.3.3 开源解决方案

2.4 链路跟踪系统

2.4.1 应用场景与设计目标

2.4.2 系统架构

2.5 本章总结

第3章 中台技术之在线算法系统

3.1 物料检索系统

3.1.1 倒排检索

3.1.2 倒排索引实例

3.1.3 相似检索

3.1.4 相似检索实例

3.1.5 模型粗排

3.2 模型预估服务

3.2.1 整体架构

3.2.2 多框架支持

3.2.3 模型上线

3.2.4 在线预估

3.2.5 异构设备

3.2.6 性能优化

3.2.7 效果监控

3.3 策略机制引擎

3.3.1 整体架构

3.3.2 计算流解释器

3.3.3 Lua 解释器

3.4 集群管理平台

3.4.1 多租户架构

3.4.2 集群动态管理

3.4.3 集群性能监控

3.4.4 配置动态分发

3.5 效果评估系统

3.5.1 背景介绍

3.5.2 设计模式

3.5.3 系统架构

3.5.4 指标计算

3.6 本章总结

第4章 中台技术之机器学习平台

4.1 机器学习平台简介

4.1.1 机器学习的研发流程

4.1.2 机器学习的研发挑战

4.1.3 机器学习的研发技术

4.2 传统机器学习算法

4.2.1 线性算法

4.2.2 因子分解机算法

4.2.3 决策树算法

4.3 深度学习算法

4.3.1 发展简史

4.3.2 神经元模型

4.3.3 神经网络模型

4.3.4 神经网络的算法原理

4.4 模型框架基本原理

4.4.1 分布式计算架构

4.4.2 并行计算的同步机制

4.4.3 梯度更新算法

4.5 层结构的模型框架

4.5.1 Caffe

4.5.2 DistBelief

4.5.3 WBLEngine

4.5.4 小结

4.6 数据流结构的模型框架

4.6.1 TensorFlow

4.6.2 PyTorch

4.6.3 小结

4.7 复合结构的模型框架

4.7.1 场景特点

4.7.2 设计思路

4.7.3 架构与实现

4.7.4 性能优化

4.7.5 小结

4.8 机器学习平台简介

4.8.1 单业务线开发阶段

4.8.2 平台化建设阶段

4.8.3 业界知名产品

4.9 新浪微博 WBL 机器学习平台

4.9.1 用户操作界面

4.9.2 管理中心

4.9.3 数据中心

4.9.4 调度中心

4.9.5 智能中心

4.9.6 模型中心

4.10 本章总结

第5章 中台技术之分布式数据库

5.1 分布式数据库概述

5.1.1 SQL 数据库

5.1.2 NoSQL 数据库

5.1.3 NewSQL 数据库

5.2 分布式数据库技术

5.2.1 ACID 理论

5.2.2 CAP 理论

5.2.3 BASE 理论

5.2.4 数据分片策略

5.2.5 数据复制策略

5.2.6 Gossip 协议

5.2.7 分布式一致性协议

5.2.8 分布式事务协议

5.3 分布式数据库产品

5.3.1 Redis

5.3.2 Google BigTable

5.3.3 Google Spanner

5.4 LaserDB 分布式数据库

5.4.1 系统架构

5.4.2 数据模型

5.4.3 分片策略

5.4.4 批量加载

5.4.5 同步机制

5.4.6 高可用架构

5.4.7 高性能方案

5.5 LaserDB 应用案例分析

5.5.1 数据缓存

5.5.2 特征服务

5.5.3 向量存储

5.5.4 样本拼接

5.6 本章总结

第6章 中台技术之大数据平台

6.1 大数据平台概述

6.1.1 大数据的特点

6.1.2 大数据平台的技术栈

6.2 分布式协调系统

6.2.1 Google Chubby

6.2.2 Apache ZooKeeper

6.2.3 Consul

6.3 集群管理系统

6.3.1 Google Borg

6.3.2 Kubernetes

6.3.3 Apache YARN

6.4 分布式文件系统

6.4.1 Google GFS

6.4.2 Apache HDFS

6.4.3 Dropbox MagicPocket

6.5 消息管道系统

6.5.1 Google PubSub

6.5.2 Apache Kafka

6.6 分布式计算系统

6.6.1 MapReduce

6.6.2 Apache Spark

6.6.3 Apache Flink

6.6.4 Apache Beam

6.7 数据仓库与分布式查询系统

6.7.1 Google BigQuery

6.7.2 Apache Hive

6.7.3 Facebook Presto

6.7.4 Facebook Scuba

6.8 本章总结

第7章 中台实践之推荐系统

7.1 推荐系统的背景简介

7.1.1 场景概况

7.1.2 整体架构

7.1.3 推荐思路

7.2 推荐系统的算法模型

7.2.1 GBDT-LR 融合模型

7.2.2 Wide &amp;#x0026;amp; Deep 模型

7.2.3 DeepFM 模型

7.2.4 双塔模型

7.2.5 多任务模型

7.2.6 算法的发展趋势

7.3 推荐系统的效果度量

7.3.1 体验指标

7.3.2 算法指标

7.4 Facebook 信息流推荐简介

7.4.1 数据分发系统

7.4.2 特征服务

7.4.3 索引系统

7.4.4 预估与排序服务

7.4.5 实时样本拼接服务

7.4.6 模型训练平台

7.5 本章总结

第8章 中台实践之数字广告

8.1 数字广告的背景简介

8.1.1 核心概念

8.1.2 合约广告

8.1.3 竞价广告

8.1.4 程序化交易广告

8.2 数字广告系统架构

8.2.1 业务平台

8.2.2 算法与数据中台

8.3 数字广告系统中的数据管理

8.3.1 站内数据

8.3.2 站外数据

8.4 数字广告系统中的受众定向

8.4.1 内容定向

8.4.2 用户标签定向

8.4.3 定制化标签定向

8.4.4 社交关系定向

8.4.5 智能定向

8.5 数字广告系统中的策略机制

8.5.1 流量预测

8.5.2 在线分配

8.5.3 频次控制

8.5.4 平滑投放

8.5.5 探索策略

8.5.6 智能出价

8.5.7 广告竞价

8.5.8 反作弊机制

8.6 本章总结

第9章 中台实践之网约车平台

9.1 业务简介

9.1.1 业务背景

9.1.2 运作流程

9.1.3 用户体验

9.2 技术架构

9.2.1 分层系统架构

9.2.2 业务中台

9.2.3 算法与数据中台

9.3 打车定价场景

9.3.1 场景描述

9.3.2 价格动态下浮策略

9.3.3 价格动态上浮策略

9.3.4 小结

9.4 打车排队场景

9.4.1 场景描述

9.4.2 排队时间预估策略

9.4.3 小结

9.5 打车安全场景

9.5.1 场景描述

9.5.2 安全策略

9.5.3 小结

9.6 本章总结

参考文献

后折页

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部