「笔记」某移动 SRE 运维体系交流

简介: 「笔记」某移动 SRE 运维体系交流

📝Notes:

可能更符合国内国企实际情况的 SRE 落地.

痛点

  • 传统竖井式 IT 架构(封闭、隔离、非标、难运维)
  • X86 服务器硬件稳定性不足
  • 开源软件可靠性不足,且不可控
  • 出了故障,被动救火救不完

转型

由此催生了转型升级的需求:

  1. 运维智能(SRE)的转型

SRE 运维模式

核心职责

保证:

  1. 业务连续性
  2. 应用连续性
  3. 平台连续性

职责分工

  1. 综合运维岗
  1. 7*24 在线或远程值班
  2. 业务监控
  3. 业务运维操作
  4. 故障处理
  5. 应急处理
  1. 运维专业组(由基础架构的:主机、存储、网络、中间件、数据库岗位演化而来)
  1. 系统架构梳理和优化
  2. 新建系统评审
  3. 故障演练
  4. 新技术引入
  5. 专业职责和经验赋能给综合运维岗,如提供数据库自动化脚本、数据库切换演练流程标准化等
  1. 运维开发
  1. 为综合运维岗开发运维工具、运维系统
  2. 收集分析运维专业组自动化、监控等需求
  3. DevOps、自动化运维、智能监控系统、容器平台等系统开发和持续迭代演进

综合运维岗 - 全栈运维入口

要点

  • 全面运维
  • 工具应用
  • 统一入口
  • 人才培育

👨‍💻 人员要求:

理工科背景;

应届生; 实习生

典型流程

事件跟踪和故障处理;

需要人工处理的交给专业组;

故障升级给 " 值班经理 "

运维专业组

  • 技术选型 - 标准化, 新技术选择,
  • 行业生态
  • 功能特性
  • 发展规划
  • 商业特性
  • 架构管控 - 实现业务连续性, 高可用, 高可靠
  • 场景提炼 - 升级、高可用切换、迁移、发布
  • 疑难处理
相关文章
|
1月前
|
存储 运维 安全
2024.3.18隐语训练营第1讲笔记:数据可信流通,从运维信任到技术信任
数据二十条提出了要建立数据可信流通体系,使得数据可以安全的流转起来。但由于在数据流通中存在的各种风险,使得信任四要素全部遭到破坏,导致信任降级甚至崩塌。为了应对这些风险,要实现从运维信任到技术信任的转变,针对信任的各个要素,提出了解决方案。最后简要介绍了安全可信基础设施的融合布局。
45 3
|
3月前
|
缓存 网络协议 数据安全/隐私保护
[运维笔记] - (命令).Windows server常用网络相关命令总结
[运维笔记] - (命令).Windows server常用网络相关命令总结
191 0
|
1月前
|
运维 安全 区块链
隐语训练营第1讲笔记:数据可信流通,从运维信任到技术信任
数据可信流通需要从运维信任转向技术信任,需要安全可信基础设施的融合布局。
42 1
|
1月前
|
存储 运维 安全
[隐私计算实训营笔记]第一课——数据可信流通,从运维信任到技术信任
本课以数据要素可信流通,重构技术信任体系为主题,介绍了信任四要素,以及其对应破环的原因,因此需要从运维信任走向技术信任的路线,并最终完成安全可信基础设施的融合布局。 感谢授课人韦韬老师~
|
1月前
|
运维 安全 数据安全/隐私保护
|
1月前
|
运维 NoSQL Linux
运维排错笔记
运维排错笔记
18 1
|
3月前
|
存储 运维 JavaScript
[运维笔记] PowerShell (模块).模块的查找、安装、卸载、更新、保存、发布
[运维笔记] PowerShell (模块).模块的查找、安装、卸载、更新、保存、发布
92 0
|
3月前
|
运维
[运维笔记] PowerShell (模块).模块清单
[运维笔记] PowerShell (模块).模块清单
28 0
[运维笔记] PowerShell (模块).模块清单
|
4月前
|
运维 安全 数据中心
和你开玩笑了?阿里P8用这份448页IT系统运维笔记,征服你
古人云,墙高基下,虽得必失。这也正是我对IT基础架构重要性的看法。关于它的千言万语,全都汇聚在这一部——有故事、有思想、有收获、接地气儿的书中。在这个冬天,我愿邀您一起来品读书香。