请选择 进入手机版 | 继续访问电脑版

ITIL,DevOps,ITSS,ITSM,IT运维管理-艾拓先锋网

 找回密码
 
搜索
热搜: ITIL DevOps SRE ITSS
查看: 727|回复: 0

SRE Foundation课程内容介绍

[复制链接]
发表于 2020-10-28 17:18:27 | 显示全部楼层 |阅读模式
本帖最后由 陈小宝 于 2020-10-28 17:23 编辑 ; a& e8 w: U- h
/ V# |* p/ E4 i/ k
8 I8 z! i. }$ e
Google SRE:起源
粘贴上传202010281616598029..png

, e1 m8 v" T( W" G4 i& v/ b$ f
Benjamin Sloss Treynor
Googlegoogle总裁。他的一个主要工作就是确保的网站永不掉线

6 W8 K- I" j; E* G
  • sre:站点可靠性工程师(Google负责7*24小时运维的VP命名)1 n. v6 \/ j! Q# H% P) ]8 Z
( S8 ^5 O9 g" N/ R0 ?( E
      1.SRE是工程师:使用计算机和软件工程手段设计和研发大型、分布式计算机软件系统;
. S1 C) a" t5 F- W1 q2 x0 p! N8 _
      2.SRE关注:焦点是可靠性,包括架构设计、运维流程优化足够可靠

0 Y' V. x3 _/ y$ N% @     3.sre主要工作:运维分布式集群系统上的具体业务服务(Service)
# V4 V( u8 W# B9 u
6 M5 `+ L! s7 b" k, d) C- K
  • SRE是一种职业:专注于整个软件系统的生命周期管理
      S4 o; C" y, d9 A9 p; w. }

- Z- m+ D( f' r! g1 m1 G8 @& Y
' I% k) H( v& C* N) G) R  Z5 yGoogle SRE:基本概念

, d# g* j* q( O
站点可靠性工程(SRE)系统管理员(sysadmin)的区别

  |; w7 V1 a  E+ ^: g
1.运维对象不同:分布式集群管理系统VS小型机、X86管理系统
. @$ l! j. R" W3 ~! J* b+ S! B0 y  E0 [
2.存在时间不同于 Google,前十年VS近十年于中国15年之后VS15年之前
+ b6 w$ c/ T% o# `9 M; @
1.技能要求不同:计算机科学+软件工程V计算机科学

5 D) ~/ S; j! D* E  c& ]2.关注焦点不同:产品可靠性VS只负责将现成的软件组件部署到生产系统
4 m* v  ]. w" ]* z( U" N- E1 p4 G: D) S$ ^
3.成员来源不同:研发工程师VS从第三方工具厂商或系统集成商招聘

/ O% a/ B4 O4 t# D. b' X
GoogleSRE实践总结
  • 传统运维模式(Dev/Ops分离的团队模式)冲突的焦点! M7 ?) k: ]/ f1 f% X+ D
5 i3 n# V0 T1 u: U% v7 e4 b3 p" {5 o
  • 直接成本相对清晰;: w& c4 F# S2 ]4 C7 _& H. t/ f
. o- ^8 h$ `5 t5 I( D0 J
% O: W( j' k5 X0 l. b
  • 间接成本差异较大(背景、技术能力、工具习惯、工作目标);
    ' b$ P, ~, g1 `; E- _$ |; o0 f

% G: y% h+ Q0 ~" {0 ^, v& G

6 }" r! F" N) Z. L9 l
  • 初步演变为目标与方向上的分歧以及内部沟通严重问题,上升到部门之间的信任与尊重: H; u" B: h9 E
8 `& ?8 O! _$ x2 ?
9 _3 Y5 _1 k& Y7 I9 b% ~* m0 H
传统运维模式(Dev/Ops分离的团队模式)冲突的焦点

+ r: b) C- {& A  }8 S2 H2 ^
1、直接成本相对清晰;
, o5 w. C) d, ~: S$ j( |
2、间接成本差异较大(背景、技术能力、工具习惯、工作目标);

( V4 Z# G) m: J; T! h2 ^! N
初步演变为目标与方向上的分歧以及内部沟通严重问题,上升到部门之间的信任与尊重;

7 F& u7 P8 }" d& k1 ^
# A) c3 }1 k& q7 E
传统运维模式(Dev/Ops分离的团队模式)冲突的焦点
5 S$ p& a1 r0 |" G6 B4 L
1、传统研发团队和运维团队分歧的焦点主要在软件新版本、新配置的变更的发布速度上。
0 B" Z0 x4 Q2 o
2、开发团队宣称不再进行大规模的程序更新,改为功能开关调整、增量更新和补丁化(大变更→小变更),为了绕开运维团队设立的各种流程,从而更快地上线新功能。

8 B. a+ ^4 B% f2 c& W. W5 U; w# f" k/ g) E+ ^0 h
●Google的解决之道:sre
  • SRE团队的组成:1)50%60%软件工程师)其他具备85%99%软件技能,且具备一定. r# s% m! c1 \# t( S' q& ^. R( m
       程度其他技能(UNX和网络)的工程师。

5 x4 q& F& E8 U' u
  • SRE模型的优势:1)运维人数相对少$ n" s1 ]% w1 F% {8 ~( p8 x- B- x
                               2)开发团队和运维团队的冲突焦点消除;
                               3)SRE团队和研发团队之间的成员可以自由流动。
+ ^7 `0 N6 q  h$ T* \, ^
  • SRE模型的问题:就是如何招聘合适的SRE,一直存在。
    + d8 w! q- S) c- S( K/ Z6 |, s

, e# u1 u! m7 S2 y  ^9 Q9 p
2 c4 V+ R% K. w6 Y, J! H0 M
●SRE方法论由来

2 k: m! H+ w2 b: S, n" I# m
  • SRE背景:9 J! s- ?* u. c6 N# w% M+ d7 A8 X
$ k" a9 S! O8 k9 A. \
1.SRE共有1000人+,分为多个SRE团队,每个团队有自己的工作流程、优先级定义以及日常工作规范;

& D4 b0 u/ ]- @  Z
2.SRE团队的工作职责:可用性改进、延迟优化、性能产品研发试优化、效率优化、变更管理、监控、紧急事务处理以及容量规划与管理。

! t& w7 C! F" A7 U
  • SRE方法论是什么:所有SRE团队共同的一套完整的沟通准则和行事规范。6 k6 R+ T7 m2 y, N$ O; Q

& o% n( l" P9 e, D: _3 k. |6 o9 d; L; y
  • SRE方法论的作用8 y: h4 d7 L  I6 Q3 L1 h8 F, _
  f- P) d6 s, e; t% M
      1.规定了SRE是如何 google操作生产环境的;RE部门

0 O6 ]7 Y+ R* o3 p5 f; I3 u
      2.规定了SRE如何和产品研发部门、测试部门、最终用户进行有效沟通;
/ \# S) L7 }7 }' V* w$ q
      3.帮助每个SRE团队保持良好的研发和运维工作平衡。

$ R! x+ U' u- Q) I. H0 e' `. |, N! P$ }) ]
●SRE方法论内容:
# A4 b3 B' c. f9 {
1.确保长期关注研发工作

: ~$ E- G; s) e/ b: S' I8 Z
2.在保障SLO的前提下最大化选代速度

# F" n! Q6 q- T. X- M3 u: v7 J
3.监控系统

( ?$ P; E7 L6 |5 A* Z/ C+ r
4.应急事件处理

; B( j" I& b* l* z8 a* t5 E
5.变更管理
, D; K2 ]" `. l( g9 W0 U
6.需求预测和容量规划
4 A1 @, u0 Z4 T; \
7.资源部
3 k( Q0 o/ ?8 Y+ e6 ~
8.效率与性能

& j% Q& p: s8 E4 [6 [" r) v0 c
GoogleSRE的企业价值
GoogleSRE代表了对行业现存管理大型复杂服务的最佳实践的一个重要突破

* \- K$ [' U9 [) S- t
SRE模型包含:
一套指导思想
一套方法论
一套激励方法
一个拥有广阔空间的独立职业
* @. B6 n4 A6 O6 W0 J- X, V
适用性:由于Google的独特地位,SRE模式不宜照搬,但可以深度模仿或借鉴,所以需要咨询。
4 _; R' ]& `( Q' n4 t) i" i

' O$ s5 [8 i# X! a; h, d
GoogleSRE:知识体系:
粘贴上传202010281721007482..png

7 @$ _) F2 t; X, V

, O8 O; A$ ~% [) e9 M3 I) C( B1 _
) w6 O$ E. I8 |3 y: c7 g
! s2 N' L$ @: |  J+ P9 }" s




上一篇:SRE的职业发展与定位
下一篇:SRE,运维精英的未来舞台!刘征《Google SRE体系核心基础解读》20年11月11日直播!
您需要登录后才可以回帖 登录 |

本版积分规则

本站关键字: ITIL| ITSM| ISO20000| ITIL培训| ITIL认证| ITIL考试| ITSS| ITSS培训| ITSS认证| IT运维管理| DevOps| DevOps培训| DevOps认证| itop| itil4| sre| 开源ITSM软件

QQ|艾拓先锋网 ( 粤ICP备11099876号 )|网站地图

Baidu

GMT+8, 2021-6-24 07:18 , Processed in 0.115957 second(s), 30 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表