加入收藏 | 设为首页 | 会员中心 | 我要投稿 宁德站长网 (https://www.0593zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 安全 > 正文

SRE,DevOps,PE的运维本质和价值都是为产品和业务服务

发布时间:2021-01-14 13:28:59 所属栏目:安全 来源:网络整理
导读:副标题#e# 《SRE,DevOps,PE的运维本质和价值都是为产品和业务服务》要点: 本文介绍了SRE,DevOps,PE的运维本质和价值都是为产品和业务服务,希望对您有用。如果有疑问,可以联系我们。 导读:本文是我在3月4日数人云北京站线下活动“当西方的SRE遇上东

我也会设一些虚拟的小组,类似于矩阵式管理,有一些技术小组做大数据、分布式缓存,Docker、Nginx 等等,目的是什么?有点像Google SRE的50%原则,50%的时间做开发任务.但是我没有办法让他将50%的时间完全去写程序,因为有很多事情要去做,而且我们也有专门的开发团队,但我可以设一些技术的小组,分离业务和技术的事.每个人50%的时间去做跟技术相关的事情,这样他们自己也会觉得有意思一点,最终的目的不仅是做一个纯业务的运维,而是给PE们提升的空间.

SLM服务级别管理

下技术管理上的实践,即使是互联网公司,ITIL这样偏传统的管理方式也有很多可取的地方,我们现在也用得着,并不是抛弃掉所有传统的理念,要根据公司的需要,不管是ITIL还是SRE,还是其它方法都可以借鉴,以此设计你的组织结构.我会保留传统的东西,像SLM,在SRE里叫SLO.为什么叫SLO不叫SLA了?

因为SLA是服务协议,更多时候是甲方和乙方签协议.公司内部没有协议,而是设定一个目标,开发跟运维间达成一致,要有数据化的考量.SLA或SLO都不只是一个可用性的目标,还包括很多的方向,比如维护的时间是否可靠?包括性能、备份、问题解决的时间这些都是考量的指标,不只是数字.我们内部的SLA会分得很细,根据业务的类型,对不同业务的影响会有很细的评估.

变更管理

80%的故障都是变更引起.变更很频繁,互联网公司里面每天可能都几十次、上百次的变更,测试环境没有测试到业务的问题的可能性是很大的.变更管理的内容可以再看一下,比如CMDB,变更的时候还是要有基础库做记录的,有了基础库后面才能做很多事情.

重大事件及故障管理

(编辑:宁德站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!