万本电子书0元读

万本电子书0元读

顶部广告

高性能之道: SRE视角下的运维架构实践电子书

从理论出发,以实战落脚,包括SRE事前治理、故障应急、可观测性、架构设计等多方面内容,提供了好用的工具、优秀的案例,分享技术心得体会,帮助读者事半功倍

售       价:¥

纸质售价:¥93.20购买纸书

9人正在读 | 0人评论 6.4

作       者:王力 等

出  版  社:电子工业出版社

出版时间:2023-06-01

字       数:16.9万

所属分类: 科技 > 计算机/网络 > 计算机理论与教程

温馨提示:数字商品不支持退换货,不提供源文件,不支持导出打印

为你推荐

  • 读书简介
  • 目录
  • 累计评论(0条)
  • 读书简介
  • 目录
  • 累计评论(0条)
本书从实践出发,包括了作者参与并主导的3家电商互联网公司架构从0到1的构建经历,从多个角度讲解稳定、性能、效率、成本四大职责落地经验,并结合Mikey金字塔行了部分创新,很多内容都可以直复用于实际工作。本书分为7篇,分别是端篇、监控篇、故障篇、容量篇、全局视角篇、性能篇和扩展篇。 本书适合互联网行业内的运维人员、SRE和DevOps工程师、架构师、技术团队负责人及关注用户体验的相关发者阅读,也适合掌握了一定的SRE方法论但在实践中无从下手的读者阅读。<br/>【作者】<br/>王力,资深技术老兵,《Nginx实战:基于Lua语言的配置、发与架构详解》和《高性能之道:SRE视角下的运维架构实践》作者。15年互联网从业经验,其中有9年电商互联网发和运维经验,这期间担任过微拍堂运维专家、阿里技术专家、折800运维架构师等,并有5年主导电商大促活动保障的落地经验,推过折800、微拍堂两家电商平台运维架构从0到1的建设,精通服务的稳定性建设,精通高并发场景下的性能优化和中间件发,擅长通过架构设计来优化系统复杂度、降本增效。本书提供了一些补充内容(比如对软件安装、配置的讲解等),大家可以搜微信公众号“SRE基础架构”行查阅。<br/>
目录展开

内容简介

专家力荐

前言

开端篇 弱化边界感

第1章 引 言

1.1 运维架构和SRE

1.2 理解业务,技术为业务服务

1.3 不设边界

1.4 SRE金字塔

1.5 总结

第2章 重视测试环境和预发布环境

2.1 提效和维稳的第一道门槛——测试环境

2.2 “守门员”——预发布环境

2.3 两大环境问题根本原因溯源

2.4 微拍堂测试环境治理思路介绍

2.5 总结

监控篇 底层逻辑的艺术

第3章 浅谈监控系统设计

3.1 梳理监控体系

3.2 梳理监控指标

3.3 变更监控

3.4 准实时系统监控

3.5 短时进程追踪工具

3.6 全链路监控

3.7 商业监控平台的选用建议

3.8 监控方式:白盒监控与黑盒监控

3.9 从监控数据中总结规律

3.10 黄金指标

3.11 总结

第4章 云原生可观测性开源工具——Kindling

4.1 行业现状

4.2 Kindling解决方案——关联内核可观测性数据的Trace

4.3 Kindling探针的架构设计理念

4.4 Kindling探针架构

4.5 在线Demo介绍

4.6 案例分享

4.7 总结

第5章 高阶实战——打造可持续维护的闭环流程

5.1 案例:动态观测SQL质量流程设计

5.2 案例:WebP格式图片的规范和落地实践

5.3 案例:管道通信规范化实践

5.4 标准和规范治理平台

5.5 总结

第6章 挖掘Nginx的监控价值

6.1 URI指纹服务设计

6.2 Nginx日志分析指南

6.3 总结

故障篇 故障的生命周期

第7章 事前治理的方法论

7.1 从故障中总结经验

7.2 从系统资源层面和日志中巡检异常

7.3 从标准和规范中寻找闭环之路

7.4 从业务中挖掘基础服务的使用问题

7.5 技术风险防控运营成本

7.6 总结

第8章 变更管控设计思路

8.1 变更管控

8.2 JumpServer使用的艺术及工单交互

8.3 变更三板斧:运维团队的可监控、可灰度、可回滚实践

8.4 总结

第9章 轮值的设计思路

9.1 值班模式探究

9.2 值班机器人

9.3 提升值班价值——SRE需求池设计

9.4 总结

第10章 故障演练与应急预案

10.1 故障演练缘由

10.2 故障演练流程

10.3 应急预案

10.4 总结

第11章 应急响应流程实践

11.1 收拢故障上报来源

11.2 建立应急小组

11.3 故障噪点治理

11.4 控制应急节奏

11.5 应急“止血”的常见操作

11.6 总结

第12章 静态容灾降级系统

12.1 荆棘之路

12.2 设计之路

12.3 架构流程图

12.4 核心代码解说

12.5 静态容灾的智能关闭方案

12.6 替换爬虫的新思路

12.7 总结

第13章 基于OpenResty的动态限流设计思路

13.1 常见反向代理限流方案缺点分析

13.2 动态限流设计思路

13.3 多维度限流

13.4 智能感知响应能力动态控速设计方案

13.5 屏蔽慢请求带来的服务阻塞

13.6 总结

第14章 故障复盘

14.1 复盘前

14.2 复盘中

14.3 复盘后

14.4 自省

14.5 跨部门分享

14.6 故障库

14.7 总结

容量篇 性能与成本间的平衡

第15章 成本优化

15.1 成本优化事前准备

15.2 公有云基础资源优化实践

15.3 总结

第16章 智能伸缩平台

16.1 弹性伸缩平台关键路径盘点

16.2 基础设施建设

16.3 基于业务场景的实战

16.4 风险控制体系

16.5 总结

第17章 容量规划

17.1 容量规划现状

17.2 容量规划建设思路

17.3 应用系统容量规划说明

17.4 基于巡检模式的容量评估流程

17.5 对容量规划关注点的梳理

17.6 总结

第18章 编程能力

18.1 养成写伪代码的习惯

18.2 养成管理代码的习惯

18.3 编程能力分级

18.4 编程能力更深层的价值探讨

18.5 熟悉编程语言特性

18.6 通过系统分析倒推应用配置问题

18.7 总结

全局视角篇 运维破圈

第19章 开启测试视角

19.1 测试人员的职责边界

19.2 压力测试

19.3 自动化测试监控平台设计

19.4 破坏性测试探究

19.5 从前端的体验“找碴儿”

19.6 总结

第20章 开启用户视角

20.1 内外兼顾

20.2 建立反馈机制

20.3 产品体验——谷歌SRE的高阶思维

20.4 防御体系的“误伤”指南

20.5 关注客户端环境

20.6 总结

第21章 开启前端和App开发人员视角

21.1 概述

21.2 为什么要解决性能问题

21.3 缓存

21.4 网络请求

21.5 客户端计算

21.6 预加载

21.7 梳理技术风险

21.8 总结

第22章 DNS应用场景实践

22.1 利用DNS完成故障转移

22.2 使用HTTPDNS提升访问稳定性

22.3 提升测试、A/B测试等环境的切换效率

22.4 域名反向解析用途实践

22.5 内部DNS系统高可用实践

22.6 总结

性能篇 SRE进阶之路

第23章 高并发网关价值探究

23.1 通用功能介绍

23.2 网关中的聚合模式

23.3 兼顾缓存的网关设计思路

23.4 总结

第24章 高性能Varnish缓存系统

24.1 HTTP缓存对后端服务的价值分析

24.2 CDN缓存和Varnish缓存的共存模式

24.3 安装Varnish和所需模块

24.4 配置文件概览

24.5 稳定性建设所依赖的功能

24.6 最佳实践

24.7 总结

第25章 SRE漏斗优化法则

25.1 SRE性能优化之漏斗优化法则

25.2 漏斗优化法则的技术栈梳理

25.3 总结

第26章 awesome性能分析工具

26.1 站在巨人的肩膀上工作

26.2 Netdata

26.3 总结

第27章 性能优化实践锦集

27.1 TIME_WAIT优化方案扩展

27.2 利用Ngx_Lua缩短请求链路

27.3 eBPF在Kubernetes上的应用

27.4 善用CDN

27.5 记一次中台服务优化实战

27.6 总结

扩展篇 在团队间搭建桥梁

第28章 业务开发人员视角下的技术风险

28.1 了解业务开发人员

28.2 大淘客之旅

28.3 总结

第29章 SRE视角全篇总结

29.1 齐心协力

29.2 竞品分析——最后1公里

29.3 故障降级系统——来自监控的沟通艺术

29.4 重识CMDB价值

29.5 总结

累计评论(0条) 0个书友正在讨论这本书 发表评论

发表评论

发表评论,分享你的想法吧!

买过这本书的人还买过

读了这本书的人还在读

回顶部