请选择 进入手机版 | 继续访问电脑版

ITIL,DevOps,ITSS,ITSM,IT运维管理-ITIL先锋论坛

 找回密码
 微信、QQ、手机号一键注册

扫描二维码登录本站

QQ登录

只需一步,快速开始

查看: 167|回复: 0

SRE team的第一课

[复制链接]
发表于 2020-12-14 11:44:40 | 显示全部楼层 |阅读模式
本文将与大家分享一些新加入SRE团队时应该考虑的问题。无论你是刚加入一个SRE团队的新人,亦或是公司的第一位SRE(Ops/Techops/DevOps)。笔者也曾经历过这个阶段,并尝试了很多方法去理解公司SRE当时的情况以及确定下一步行动的方向。

1 u1 G1 t! u2 g/ ?9 {
- Y' a# n) o6 B8 R+ t+ y
我把它分成了几个阶段。大家可以整体来看或者在对应的时间看自己符合的那一部分,然后对它们更加了解。如果立刻照此执行,那么将对你在新公司取得成功有所帮助。这些条目处于一个较高层级,我们可以把它们更加细分。想法从这里开始,由你的好奇心决定深入执行的程度。然而,不要在兔子洞掉得太深……可能会迷路哦。

$ P  h6 f: J7 ?
/ V( ]* s* W9 v" `, k( M# Z[backcolor=rgba(211, 207, 206, 0.118)]阶段1-新入团队,打个招呼' {0 V, p& S/ d
  • 尽量地与大家多进行沟通交流,了解他们对于当前系统状态的想法
  • 尽可能地思考更多有关团队的问题,了解每个团队希望达成的目标
  • 找出所有目前系统中大家的痛点
  • 询问每个团队:如果有一处可以改进,那它是什么?
  • 找到团队里资格最老的成员,然后让他们讲出团队里一些不为人知的秘密
  • 做笔记!!!这一条如何强调都不为过。尽管你很聪明,但是把东西记下来是通向成功的关键
  • 弄清楚你和你的团队预期的是什么,都有哪些支持

    ; r2 Z/ `/ L) e8 m% a, g

( v. q+ z' I& X* A5 ~" S! q
0 W4 }* b6 t1 O6 [[backcolor=rgba(211, 207, 206, 0.118)]阶段2-了解物理/虚拟设备
9 K8 ~2 B; n3 H$ I
你需要了解的物理/虚拟设备包括:

) R1 ?! p# g* a( C1 j
设备规划

6 G1 e5 n8 f* }
  • 云、物理机还是混合式?
  • 托管主机or自有主机?
  • 硬件类型&供应商(底盘,CPU,内存,磁盘,网络等)

    8 |+ W* }# A& j+ p! Z3 {

7 W4 n& ?9 n; t: u, P7 s
操作系统设计
7 v2 o, i% ^( C$ ^
  • OS发行版&版本
  • 基础or定制驱动?
  • OS/内核调谐
  • 自定义编辑库(如果有)
  • 自定义OS微调(如果有)

    * A- B  g7 S2 L" _

; A1 ~* s' e+ Y
基础设施服务

: f- v$ `0 O- h' ~1 ?) l
  • 文件当前状态
  • 监控系统
  • 配置管理(如果有)
  • 通用基础设施工具(例如DNS,DHCP,PXE,LDAP)
  • 基础设施工具(用户服务&工具)
  • Github/Gitlab/SVN工作流(团队repo,CI/CD等)
  • 部署机制
  • 外部工具依赖
  • 应用团队所使用的数据库/队列/服务
    " D8 m* G' j( N1 {. Y& P6 i

; k: ?2 s7 d- |7 A. h* h8 x9 l8 o; U$ ~/ ?; a! k1 p
[backcolor=rgba(211, 207, 206, 0.118)]阶段3-了解应用/服务
0 G/ A4 E8 Y  Q8 |
你需要了解的应用/服务包括:

0 P0 z# G/ d$ A4 Y
应用/服务当前状态

8 A3 Y& Z8 J1 ~- z( u  S
  • 应用数量(有多少不同的app)
  • 应用类型(这些app在做什么)
  • 环境语言
  • 依赖栈
  • 文件的当前状态
  • 应用监控
  • 应用环境中的常见问题
  • 宕机待命和扩展策略(如果有)
    8 [6 z- U9 e# a

4 t- y+ U" B8 [1 B. B
应用/服务未来需求6 A; X: }/ G' R: _

0 ^3 |) R) x3 J6 U9 H* x
  • SRE团队组织的期望
  • 需要的新技术
  • 可以做的改进架构调整
    " l9 k, e( N* U1 `! r4 S; T

  w. g  l: ~2 ?. e7 r) G
( G0 w3 U! l; C8 X1 H[backcolor=rgba(211, 207, 206, 0.118)]阶段4-开始工作!
/ U6 y4 L5 H3 \5 w2 m2 D
  • 改进/实现当前设施的状态和架构
  • 改进/实现环境部署(物理机或者虚拟机)的进程
  • 改进/实现环境中服务的工具
  • 改进/实现配置管理
  • 改进/实现软件部署的最佳实践
  • 改进/实现团队外部(技术&非技术岗)的人际关系
  • 改进/实现尽可能多你可以为公司目标带来好处的方面

    5 t1 F; _; X: j2 e$ ]5 W
$ X, h+ @, V! `: M- o; t  ?
) E: V9 Y- m; h6 R* W9 V1 L7 H8 a
最终的阶段总是最有趣的。这时你已经收集到了足够的信息,可以将你基于公司环境的想法付诸实践。虽然现在并不是所有人所有事都遵从你的建议,但是都在往预期的方向发展。作为团队成员,大家的做法都是有依据的,他们按照自己的想法以一定的方式来执行。无论它是否对你有意义,你都不应该嘲笑或者贬低他们的决定。对于那个时间点的他们来说可能已经做得足够好,这时你应该根据过去的经验和知识为他们提供改进的意见和建议。

4 f3 T% N; |4 V% K/ `. {" Q
你的到来是因为公司认定你会带来价值。然而许多人就职SRE以后往往被无视了,因为还没有真正理解之前就开始抱怨,并不能实现他们应有的价值。笔者也在努力让这种事情不再发生,大家通力合作,共建一种更好的技术文化。

/ L2 F/ i5 J: H8 Y. o/ C




上一篇:VMware 产品中你分析出哪些SRE的概念
下一篇:从SRE与运维的思考中我们得出了4个总结

本版积分规则

本站关键字: ITIL| ITSM| ISO20000| ITIL培训| ITIL认证| ITIL考试| ITSS| ITSS培训| ITSS认证| IT运维管理| DevOps| DevOps培训| DevOps认证| itop| itil4| sre| 开源ITSM软件

QQ|小黑屋|手机版|Archiver|艾拓先锋网 ( 粤ICP备11099876号-1 )|网站地图

Baidu

GMT+8, 2021-3-7 10:36 , Processed in 0.156775 second(s), 30 queries .

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表