本规范致力于优化运营与产研团队在线问题管理的效率与效果,全面覆盖生产问题的识别、处理机制、分类分级、责任归属和明确奖惩机制。同时,侧重资源重点解决主流程关联的核心模块生产问题。如此,确保各个环节责任到人,内容详实,助力团队高效协同。
在互联网产品研发、运维、迭代及服务提供的全过程中,由于技术缺陷、流程不畅、资源配置不当、系统设计不合理或外部因素干扰等原因,导致的阻碍产品功能实现、用户体验下降、服务效率减低、安全性受损或业务目标受阻的一系列问题。
这些问题涵盖了从软件开发的前端、后端、数据处理、系统架构到运维管理、用户体验、市场适应性等多个层面,需要通过系统化的管理和技术手段,包括但不限于敏捷开发、持续集成与交付(CI/CD)、自动化测试、DevOps文化、项目管理工具的应用、以及细致的用户反馈循环机制等,进行预防、识别、分析和解决,以保障互联网产品与服务的高质量持续发展。系统化处理互联网生产问题还涉及建立跨部门协作机制,确保问题能够快速响应并得到有效解决,同时促进团队间的知识共享与经验积累,不断优化生产流程,提升整体的生产效能和市场竞争力。
线上问题级别 |
级别定义 |
P0 |
致命/Blocker/S0: 这是最严重的级别,通常指那些导致系统完全无法使用、崩溃、数据丢失或严重安全漏洞的bug。例如,系统崩溃、死机、数据库死锁、应用无法启动或异常退出等。这些问题需要立即修复,因为它们严重影响了系统的稳定性和安全性。 备注:生产数据影像范围+时间周期 |
P1 |
严重/Critical/S1: 指影响核心功能的bug,虽不至于让系统完全不可用,但显著影响主要功能的执行或导致重要数据的不准确。比如,主要功能失效、严重的性能问题、数据损坏但可恢复等。这些问题通常需要在下一个版本或补丁中优先修复。 |
P2 |
一般/Major/S2: 包括那些不影响系统稳定性或主要功能,但对用户体验有较大影响的问题,如界面错误、次要功能故障、性能下降等。这些问题虽然不是最紧急的,但也需要计划修复以提升产品质量。 |
P3 |
轻微/Minor/S3: 涉及到的是小错误或建议性的改进,比如错别字、UI小瑕疵、非核心功能的小问题等,这些bug虽然不会直接影响系统运行,但累积起来可能影响用户体验。修复优先级相对较低。 |
P4 |
建议性/低/S4: 指对功能影响极小或不影响功能的bug,通常是用户体验上的微小瑕疵,或是文档、提示信息的不准确。这些问题往往被安排到最后处理,或作为产品迭代时的优化项考虑。 |
注:有工单系统的公司,可通过工单来串联各协同部门。
用户=》运营=》产品=》技术。
注:不同级别处理时间要求,可结合公司实际情况确定
线上问题级别 |
级别定义 |
处理时间要求 |
P0 |
致命/Blocker/S0: 这是最严重的级别,通常指那些导致系统完全无法使用、崩溃、数据丢失或严重安全漏洞的bug。例如,系统崩溃、死机、数据库死锁、应用无法启动或异常退出等。这些问题需要立即修复,因为它们严重影响了系统的稳定性和安全性。 |
30分钟内 备注:响应及时性(5分钟) |
P1 |
严重/Critical/S1: 指影响核心功能的bug,虽不至于让系统完全不可用,但显著影响主要功能的执行或导致重要数据的不准确。比如,主要功能失效、严重的性能问题、数据损坏但可恢复等。这些问题通常需要在下一个版本或补丁中优先修复。 |
4小时内 |
P2 |
一般/Major/S2: 包括那些不影响系统稳定性或主要功能,但对用户体验有较大影响的问题,如界面错误、次要功能故障、性能下降等。这些问题虽然不是最紧急的,但也需要计划修复以提升产品质量。 |
2天内 |
P3 |
轻微/Minor/S3: 涉及到的是小错误或建议性的改进,比如错别字、UI小瑕疵、非核心功能的小问题等,这些bug虽然不会直接影响系统运行,但累积起来可能影响用户体验。修复优先级相对较低。 |
2天内 |
P4 |
建议性/低/S4: 指对功能影响极小或不影响功能的bug,通常是用户体验上的微小瑕疵,或是文档、提示信息的不准确。这些问题往往被安排到最后处理,或作为产品迭代时的优化项考虑。 |
最近版本 |
注:有客服团队公司,则客户问题统一由客服团队收集汇总。
处理原则遵循“一竿子原则”。所谓“一杆子到底”,指当日值班同学需将问题一追到底,直至问题闭环处理完毕为止。
注:不同线上问题,不同公司根据实际情况定级。
注:不同级别线上问题奖惩,公司可根据实际情况确定。
惩:
线上问题级别 |
级别定义 |
责任人当月绩效 |
一级事故 (P0) |
致命/Blocker/S0: 这是最严重的级别,通常指那些导致系统完全无法使用、崩溃、数据丢失或严重安全漏洞的bug。例如,系统崩溃、死机、数据库死锁、应用无法启动或异常退出等。这些问题需要立即修复,因为它们严重影响了系统的稳定性和安全性。 |
1、若当月发生一次,则当月绩效为C |
二级事故 (P1) |
严重/Critical/S1: 指影响核心功能的bug,虽不至于让系统完全不可用,但显著影响主要功能的执行或导致重要数据的不准确。比如,主要功能失效、严重的性能问题、数据损坏但可恢复等。这些问题通常需要在下一个版本或补丁中优先修复。 |
1、若单月发生一次,则当月绩效不能为A 2、若当月发生3次及以上,则当月绩效为C |
三级事故 (P2) |
一般/Major/S2: 包括那些不影响系统稳定性或主要功能,但对用户体验有较大影响的问题,如界面错误、次要功能故障、性能下降等。这些问题虽然不是最紧急的,但也需要计划修复以提升产品质量。 |
1、若当月发生一次,则当月绩效减15分 2、若当月发生两次,则当月绩效上限为B |
四级事故 (P3) |
轻微/Minor/S3: 涉及到的是小错误或建议性的改进,比如错别字、UI小瑕疵、非核心功能的小问题等,这些bug虽然不会直接影响系统运行,但累积起来可能影响用户体验。修复优先级相对较低。 |
1、若当月发生一次,则当月绩效减10分 2、若当月发生三次以上,则当月绩效上限为B |
五级事故 (P4) |
建议性/低/S4: 指对功能影响极小或不影响功能的bug,通常是用户体验上的微小瑕疵,或是文档、提示信息的不准确。这些问题往往被安排到最后处理,或作为产品迭代时的优化项考虑。 |
1、当月绩效减5分 2、若当月发生三次以上,则当月绩效上限为B |
奖:
说明:核心模块定义为P0或P1级别。
组别 |
核心模块 |
核心功能 |
负责人(技术/产品) |
金融组 |
白条 |
准入用户、白条用户、借款、还款、产品费率、锁定额度、前置机、CBS、签约授信 |
王基明/王千璐 |
支付相关 |
公众号支付、小程序支付、支付宝支付、代付、线下支付、充值、提现、对账、ERP、分账、转账 |
王基明/应高 |
|
用户相关 |
注册、e签宝、开户、账户激活、账户解冻、修改用户信息 |
王基明/王千璐/李飞扬 |