【产研测类】线上问题处理机制

· 浏览次数 : 6

小编点评

| **版本** | **严重程度** | **严重级别** | |---|---|---| | 1 | S1 | P0 | | 2 | S2 | P2 | | 3 | S3 | P3 | | 4 | S4 | P4 |

正文

1   概述

本规范致力于优化运营与产研团队在线问题管理的效率与效果,全面覆盖生产问题的识别处理机制分类分级责任归属明确奖惩机制。同时,侧重资源重点解决主流程关联的核心模块生产问题。如此,确保各个环节责任到人,内容详实,助力团队高效协同。

2  线上问题

2.1 线上问题定义

在互联网产品研发、运维、迭代及服务提供的全过程中,由于技术缺陷、流程不畅、资源配置不当、系统设计不合理或外部因素干扰等原因,导致的阻碍产品功能实现、用户体验下降、服务效率减低、安全性受损或业务目标受阻的一系列问题。

这些问题涵盖了从软件开发的前端、后端、数据处理、系统架构到运维管理、用户体验、市场适应性等多个层面,需要通过系统化的管理和技术手段,包括但不限于敏捷开发、持续集成与交付(CI/CD)、自动化测试、DevOps文化、项目管理工具的应用、以及细致的用户反馈循环机制等,进行预防、识别、分析和解决,以保障互联网产品与服务的高质量持续发展。系统化处理互联网生产问题还涉及建立跨部门协作机制,确保问题能够快速响应并得到有效解决,同时促进团队间的知识共享与经验积累,不断优化生产流程,提升整体的生产效能和市场竞争力。

2.2 线上问题级别

线上问题级别

级别定义

P0

致命/Blocker/S0: 这是最严重的级别,通常指那些导致系统完全无法使用、崩溃、数据丢失或严重安全漏洞的bug。例如,系统崩溃、死机、数据库死锁、应用无法启动或异常退出等。这些问题需要立即修复,因为它们严重影响了系统的稳定性和安全性。

备注:生产数据影像范围+时间周期

P1

严重/Critical/S1: 指影响核心功能的bug,虽不至于让系统完全不可用,但显著影响主要功能的执行或导致重要数据的不准确。比如,主要功能失效、严重的性能问题、数据损坏但可恢复等。这些问题通常需要在下一个版本或补丁中优先修复。

P2

一般/Major/S2: 包括那些不影响系统稳定性或主要功能,但对用户体验有较大影响的问题,如界面错误、次要功能故障、性能下降等。这些问题虽然不是最紧急的,但也需要计划修复以提升产品质量。

P3

轻微/Minor/S3: 涉及到的是小错误或建议性的改进,比如错别字、UI小瑕疵、非核心功能的小问题等,这些bug虽然不会直接影响系统运行,但累积起来可能影响用户体验。修复优先级相对较低。

P4

建议性/低/S4: 指对功能影响极小或不影响功能的bug,通常是用户体验上的微小瑕疵,或是文档、提示信息的不准确。这些问题往往被安排到最后处理,或作为产品迭代时的优化项考虑。

3  线上问题处理

3.1  处理流程

注:有工单系统的公司,可通过工单来串联各协同部门。

用户=》运营=》产品=》技术。

  • 用户反馈:用户通过多渠道提交问题或建议,运营团队24小时内响应确认。
  • 运营初步处理:快速分类反馈(如功能、界面问题),记录详尽信息,准备转交。
  • 产品分析决策:产品团队接收汇总报告,深入分析问题,根据影响程度和资源,设定优先级和解决方案方向。
  • 技术实施:技术团队根据产品部门的方案,评估技术可行性,规划开发时间表,执行修复或开发,通过严格测试保证质量。
  • 反馈用户与验证:修复后内部验证无误,通知用户更新,并邀请原始反馈者验证处理结果,确保满意。
  • 效果跟踪与总结:监控用户反馈,评估处理成效,定期总结经验,优化流程。
  • 持续优化循环:基于用户反馈持续迭代产品,提升用户体验,定期回顾流程,提高处理效率。

3.2  处理时间要求

注:不同级别处理时间要求,可结合公司实际情况确定

线上问题级别

级别定义

处理时间要求

 

P0

致命/Blocker/S0: 这是最严重的级别,通常指那些导致系统完全无法使用、崩溃、数据丢失或严重安全漏洞的bug。例如,系统崩溃、死机、数据库死锁、应用无法启动或异常退出等。这些问题需要立即修复,因为它们严重影响了系统的稳定性和安全性。

30分钟内

备注:响应及时性(5分钟)

P1

严重/Critical/S1: 指影响核心功能的bug,虽不至于让系统完全不可用,但显著影响主要功能的执行或导致重要数据的不准确。比如,主要功能失效、严重的性能问题、数据损坏但可恢复等。这些问题通常需要在下一个版本或补丁中优先修复。

4小时内

P2

一般/Major/S2: 包括那些不影响系统稳定性或主要功能,但对用户体验有较大影响的问题,如界面错误、次要功能故障、性能下降等。这些问题虽然不是最紧急的,但也需要计划修复以提升产品质量。

2天内

P3

轻微/Minor/S3: 涉及到的是小错误或建议性的改进,比如错别字、UI小瑕疵、非核心功能的小问题等,这些bug虽然不会直接影响系统运行,但累积起来可能影响用户体验。修复优先级相对较低。

2天内

P4

建议性/低/S4: 指对功能影响极小或不影响功能的bug,通常是用户体验上的微小瑕疵,或是文档、提示信息的不准确。这些问题往往被安排到最后处理,或作为产品迭代时的优化项考虑。

最近版本

3.3   处理原则

注:有客服团队公司,则客户问题统一由客服团队收集汇总。

处理原则遵循“一竿子原则”。所谓“一杆子到底”,指当日值班同学需将问题一追到底,直至问题闭环处理完毕为止。

  • 当日值班同学接收到问题后,必须在5分钟内将问题传递给领域主要负责同学
  • 领域主要负责同学接收到问题后,快速判定问题级别,然后推动相关同学快速解决
  • 领域主要负责同学推动问题解决后,及时给当日值班同学反馈,完成问题处理闭环

4  线上问题归类、定级及定责

注:不同线上问题,不同公司根据实际情况定级。

 

5  线上问题奖惩

注:不同级别线上问题奖惩,公司可根据实际情况确定。

惩:

线上问题级别

级别定义

责任人当月绩效

一级事故

(P0)

致命/Blocker/S0: 这是最严重的级别,通常指那些导致系统完全无法使用、崩溃、数据丢失或严重安全漏洞的bug。例如,系统崩溃、死机、数据库死锁、应用无法启动或异常退出等。这些问题需要立即修复,因为它们严重影响了系统的稳定性和安全性。

1、若当月发生一次,则当月绩效为C

二级事故

(P1)

严重/Critical/S1: 指影响核心功能的bug,虽不至于让系统完全不可用,但显著影响主要功能的执行或导致重要数据的不准确。比如,主要功能失效、严重的性能问题、数据损坏但可恢复等。这些问题通常需要在下一个版本或补丁中优先修复。

1、若单月发生一次,则当月绩效不能为A

2、若当月发生3次及以上,则当月绩效为C

三级事故

(P2)

一般/Major/S2: 包括那些不影响系统稳定性或主要功能,但对用户体验有较大影响的问题,如界面错误、次要功能故障、性能下降等。这些问题虽然不是最紧急的,但也需要计划修复以提升产品质量。

1、若当月发生一次,则当月绩效减15分

2、若当月发生两次,则当月绩效上限为B

四级事故

(P3)

轻微/Minor/S3: 涉及到的是小错误或建议性的改进,比如错别字、UI小瑕疵、非核心功能的小问题等,这些bug虽然不会直接影响系统运行,但累积起来可能影响用户体验。修复优先级相对较低。

1、若当月发生一次,则当月绩效减10分

2、若当月发生三次以上,则当月绩效上限为B

五级事故

(P4)

建议性/低/S4: 指对功能影响极小或不影响功能的bug,通常是用户体验上的微小瑕疵,或是文档、提示信息的不准确。这些问题往往被安排到最后处理,或作为产品迭代时的优化项考虑。

1、当月绩效减5分

2、若当月发生三次以上,则当月绩效上限为B

 

奖:

  • 提出建设性建议,推进团队提质、提效的员工,绩效可增加30分

6  核心模块、功能、负责人

说明:核心模块定义为P0或P1级别。

组别

核心模块

核心功能

负责人(技术/产品)

金融组

白条

准入用户、白条用户、借款、还款、产品费率、锁定额度、前置机、CBS、签约授信

王基明/王千璐

支付相关

公众号支付、小程序支付、支付宝支付、代付、线下支付、充值、提现、对账、ERP、分账、转账

王基明/应高

用户相关

注册、e签宝、开户、账户激活、账户解冻、修改用户信息

王基明/王千璐/李飞扬

 

7   版权区

  •    转载博客,必须注明博客出处
  •    博主网址:http://www.cnblogs.com/wangjiming/
  •    如您有新想法,欢迎提出,邮箱:2098469527@qq.com
  •   专业.NET之家技术QQ群:490539956
  •   专业化Java之家QQ群:924412846
  •   有问必答QQ群:2098469527
  •   一对一技术辅导QQ:2098469527

与【产研测类】线上问题处理机制相似的内容:

【产研测类】线上问题处理机制

1 概述 本规范致力于优化运营与产研团队在线问题管理的效率与效果,全面覆盖生产问题的识别、处理机制、分类分级、责任归属和明确奖惩机制。同时,侧重资源重点解决主流程关联的核心模块生产问题。如此,确保各个环节责任到人,内容详实,助力团队高效协同。 2 线上问题 2.1 线上问题定义 在互联网产品研发、运

DevOps | 产研协同效能提升之评审、审批流、质量卡点

研发过程中有各种需求的评审、审批流和质量卡点,有的是为了质量把关,有的是为了彰显权力,还有一些是为了信息告知。本文主要讨论在软件开发过程中涉及的评审、审批和质量卡点三种情况,同时探讨对研发流程的影响,在这过程中如何去提效。 同团队内部评审 同团队之间的评审包括产品团队内部的PRD评审,RD团队内部的

【原创】基于Scrum框架产研团队运作20问

学习完了 Scrum,实际使用中,是否遇到/思考过下面的问题? Product Owner的老板是谁、谁来给 Product Owner打绩效、考核的标准是啥? Scrum Master 的老板是谁、谁来给Scrum Master打绩效、考核的标准是啥? Scrum Master 是教练,团队成员表

[转帖]测试架构师必备的知识体系

https://www.jianshu.com/p/57fc1e0dd945 要想针对当前的产研情况做出最恰当的测试选择,除了对测试的把控能力之外,行业、产品、业务、架构、实现、项目管理等都是测试策略需要考虑的因素,这就要求测试架构师能用全局的视角,系统分析和解决问题。 制定测试策略本身也有很多技术

DevOps|破除壁垒,重塑协作-业务闭环释放产研运协作巨大效能

- 会议太多了,员工开会效率降低了50%! 上篇文章《研发效能组织架构:职能独立vs业务闭环》介绍了职能独立型组织架构和业务闭环型组织架构的特点,优劣势。也许有的小伙伴可能对这两种组织架构没有深刻的体会,而本文就是想通过数据说话,想仅仅通过计算这两种组织架构下开会时间这一项,让大家知晓职能型组织架构

[转帖]发布策略知多少?蓝绿 / 红黑 / 灰度 / 滚动...

https://my.oschina.net/koderover/blog/5608477 随着市场的快速发展,产研团队需要更快迭代需求、更高频发布变更。但由于无法完全模拟线上流量和真实场景,频繁发布可能导致整个系统风险。当出现一个小问题,就可能导致服务的可用性受损、用户体验甚至客户服务受到影响。而

DevOps|研发效能价值如何衡量

现在很多公司都在做或者计划做研发效能,也知道研发效能工作很重要,能提高产研运同学的协同效率,提高员工的工作效率和质量,提高业务交付效率和交付质量,但是价值有多大?效率又有多高呢?因为不容易说清楚,所以经常碰到一些质疑和灵魂拷问。 如何衡量研发效能的效果? 如何衡量研发效能的作用? 如何说清楚研发效能

DevOps|研发效能不是老板工程,是开发者服务

有人说研发效能是老板工程。不是的,研发效能不是老板工程,它不直接服务于老板(虽然老板可能看一些报表),反而是服务于广大产研运(产品+研发+质量+运维)的同学,所以有的公司也把研发效能叫做基础中台,平台工程,开发者服务团队,或者叫开发者服务平台。做好研发效能,做好开发者中台,就容易把公司的各种中后台能

DevOps|AGI : 智能时代研发效能平台新引擎(上)

AGI 的出现,给了我们一个新视角去审视我们做过的系统,尤其是研发效能平台。研发效能平台作为一个工具平台,本质就是提高公司整体产研的效率。AGI 的快速进步大家已经有目共睹,本文就是在项目协同,代码管理、测试、AIOps等方面来探讨 AGI 可以给研发效能平台带来的巨大变化效率提升。拥抱 AGI,吸

研发效能|DevOps 是运维还是开发?

DevOps 到底是 Dev还是Ops?答:属于研发工程师序列,偏向研发域,而不是运维域。 DevOps是研发工程师 DevOps 主要服务的对象就是所有产研团队的人员,与产研团队打交道比较多,相互配合更多,所以 DevOps 划分到 Dev 一侧比较好。 Ops 更专注底层基础设施,IaaS,Pa