[size=100%]
* A$ R% m" r1 d3 e
, b3 {, t- R7 d" ?; u
[size=100%]近几年业界对 SRE 的关注越来越多,但是对于 SRE 的认知确实参差不齐,存在一些误区:
[size=100%]1、SRE 就是运维。只能说 SRE 包含与传统运维相近的因素,但SRE是一个综合型技能的岗位,需要很多方面的技能。
[size=100%]2、SRE 不需要懂业务。准确的说,没有一种工作是可以脱离业务而单独存在的,SRE要参与的技术与运维架构的优化与未来规划等,脱离业务是无法完成的。
[size=100%]SRE全称:Site Reliability Engineering,翻译:站点可靠性工程师。SRE的职责确保站点的可用,为了达到这个目的,他需要对站点涉及的系统、组件熟悉,需要关注生产运行时的状态。
[size=100%]
[size=100%]在谷歌定义 SRE的一些拥抱合理的风险、自动化、合理化、简单化等原则中,我们不难看出大型互联网企业对于 SRE 的渴求,薪资也是较高水平:
[size=100%]
[size=100%]11月27-28日,第十五届 GOPS 2020 全球运维大会将在上海盛大开幕! 在会前两天的 SRE(站点可靠性工程)Foundation 课程是对 SRE 原理和实践的介绍课程,使组织能够可靠且经济地扩展关键服务。引入SRE(站点可靠性工程)需要组织重新调整,关注工程和自动化并采用一系列新的工作范式。
[size=100%]该课程重点介绍了SRE的发展及其未来方向,并为参与者提供了实践,方法和工具,以使整个组织中的人们参与到可靠性和稳定性中,这些案例通过使用真实场景和案例来证明。完成课程后,学员将在回到公司后可以切实地利用诸如了解,设置和跟踪服务水平目标(SLO)的内容。
[size=100%]该课程使学习者能够成功完成 SRE Foundation 认证考试。
[size=100%]课程受众 [size=100%]SRE Foundation 课程的目标受众是专业人员 |
| [size=100%]任何对现代IT领导力和组织变革方法感兴趣的人 | | |
| | | |
| | | |
| | | |
' R8 }3 R( y) u: f0 F# ~; `
+ V7 _& S& M {7 o: [* `
- 什么是站点可靠性工程?
- SRE和DevOps:有什么区别?
- SRE原则与惯例! [2 t) {4 l3 S0 J& D
[size=100%]模块2:服务水平目标和错误预算
! |) U2 m- U$ B3 S& Q- j# y" l6 ^) W
5 ` f/ T- [! \ D
- 服务水平目标(SLO)
- 错误预算
- 错误预算政策1 L: ]/ F# K5 _+ y
( H g* ^; S( w9 ~: `1 q- a. H
3 Z6 n+ Y5 G9 w. s; j% @- n- 什么是苦工?
- 为什么很辛苦?
# S8 ?; F3 J3 M! g
[size=100%]模块4:监控和服务水平指示器
$ G5 v1 `" \" Z& z" j9 y% q S/ G4 |4 {
- 服务水平指标(SLI)
- 监控
- 可观察性+ A3 Y1 i7 A3 n8 D, `
2 W* p- G7 N b9 |' {3 ^ n% n6 z
) y6 o/ c. |% Z& ^- 自动化定义
- 自动化焦点
- 自动化类型的层次结构
- 安全自动化
- 自动化工具- S+ Q( L- ]+ y7 N( p1 l
[size=100%]模块6:抗脆弱性和从失败中学习
6 n Q/ n% l7 |+ I
6 z0 ?) {+ n6 s* W u
- 为什么要从失败中学习
- 抗脆性的好处
- 转移组织平衡
5 L0 H$ s, ~' }/ k" l [4 v
" }* `1 b5 g5 Q, I
) H/ e6 |' }" `9 _& `( |- 为什么组织采用SRE
- SRE采用的模式
- OnCall
- 事后回顾与反思总结
- SRE和规模, y9 g: N/ Z* J7 a3 S
# X3 J2 ~2 C: R! ?! q
2 V! c0 L/ t9 r2 ]- d+ Q) x, J- SRE和其他框架
- 未来
- 其他信息来源
- 考试准备
- 考试要求,问题权重和术语表
- 考试样题复习2 u4 H) W" m2 m$ e5 H; i
[size=100%]SRE Foundation 课程的学习目标包括对以下方面的实践与理解:
+ |% o) O* D* x; n4 L* I& y. [! Y' i B q2 R( ^, Z3 C* I/ O
- SRE的历史及其在Google中的实践
- SRE与DevOps和其他流行框架的相互关系
- SRE背后的基本原则
- 服务水平目标(SLO)及其用户关注点
- 服务水平指标(SLI)和现代化的监控环境
- 错误预算和相关的错误预算策略
- 可观测性可以指示服务的运行状况
- SRE工具,自动化技术和安全性的重要性
- 抗脆弱性,我们的失败和失败测试方法
- 引入SRE带来的组织影响2 @5 |/ s9 c. V
+ V+ z: x% e# f& U