「笔记」某移动SRE运维体系交流
笔记,移动,sre,体系,交流
·
浏览次数 : 103
小编点评
## IT架构转型升级需求分析
**痛点:**
* **封闭、隔离、非标、难运维:**传统竖井式架构封闭性限制了代码可移植性,隔离性降低了代码维护性,非标性缺乏标准化,难运维容易出现故障。
* **硬件稳定性不足:**X86服务器缺乏可扩展性,无法满足未来应用程序的增长需求。
* **软件可靠性不足:**开源软件可靠性有限,缺乏安全保障措施。
* **不可控出了故障:**被动救火救不完,无法及时处理故障,导致系统性能下降。
**转型升级目标:**
* **运维智能(SRE)转型模式核心职责保证:**业务连续性应用连续性平台连续性职责分工综合运维岗7*24 在线或远程值班业务监控业务运维操作故障处理应急处理运维专业组。
**新系统架构设计:**
* **DevOps、自动化运维、智能监控系统、容器平台等系统开发和持续迭代演进综合运维岗:**提供数据库自动化脚本、数据库切换演练流程标准化等运维开发为综合运维岗开发运维工具、运维系统收集分析运维专业组自动化、监控等需求。
* **全栈运维入口要点全面运维工具应用统一入口人才培育:**打造跨平台、多语言、可扩展的运维工具,提升人力资源利用率,缩短运维周期。
**关键技术选型:**
* **SRE转型:**标准化、新技术选择、行业生态功能特性发展规划商业特性架构管控。
* **DevOps、自动化运维、智能监控系统、容器平台:**实现业务连续性、高可用、高可靠场景提炼。
**升級需求:**
* **实现业务连续性、高可用、高可靠场景提炼:**升级、高可用切换、迁移、发布疑难处理三人行。
**人才需求:**
* 理工科背景;应届生; 实习生典型流程事件跟踪和故障处理;需要人工处理的交给专业组;故障升级给\"值班经理\"运维专业组技术选型。
正文
痛点
- 传统竖井式IT架构(封闭、隔离、非标、难运维)
- X86 服务器硬件稳定性不足
- 开源软件可靠性不足,且不可控
- 出了故障,被动救火救不完
转型
由此催生了转型升级的需求:
- 运维智能(SRE)的转型
SRE运维模式
核心职责
保证:
- 业务连续性
- 应用连续性
- 平台连续性
职责分工
- 综合运维岗
- 7*24 在线或远程值班
- 业务监控
- 业务运维操作
- 故障处理
- 应急处理
- 运维专业组(由基础架构的:主机、存储、网络、中间件、数据库岗位演化而来)
- 系统架构梳理和优化
- 新建系统评审
- 故障演练
- 新技术引入
- 专业职责和经验赋能给综合运维岗,如提供数据库自动化脚本、数据库切换演练流程标准化等
- 运维开发
- 为综合运维岗开发运维工具、运维系统
- 收集分析运维专业组自动化、监控等需求
- DevOps、自动化运维、智能监控系统、容器平台等系统开发和持续迭代演进
综合运维岗 - 全栈运维入口
要点
👨💻 人员要求:
理工科背景;
应届生; 实习生
典型流程
事件跟踪和故障处理;
需要人工处理的交给专业组;
故障升级给"值班经理"
运维专业组
- 技术选型 - 标准化, 新技术选择,
- 架构管控 - 实现业务连续性, 高可用, 高可靠
- 场景提炼 - 升级、高可用切换、迁移、发布
- 疑难处理
三人行, 必有我师; 知识共享, 天下为公. 本文由东风微鸣技术博客 EWhisper.cn 编写.
与「笔记」某移动SRE运维体系交流相似的内容: