随着市场的快速发展,产研团队需要更快迭代需求、更高频发布变更。但由于无法完全模拟线上流量和真实场景,频繁发布可能导致整个系统风险。当出现一个小问题,就可能导致服务的可用性受损、用户体验甚至客户服务受到影响。而随着云技术和基础架构的成熟,发布过程中可以通过引入相应的发布策略,能让我们在早期实验阶段就可以发现、调整问题,来保证整体系统的稳定性。
目前常见的发布策略有蓝绿发布、红黑发布、金丝雀(灰度)发布、滚动发布等。下面主要介绍这几种发布策略的基本概念和原理,最后介绍如何通过 Zadig 来高效发布变更。
不同的发布策略及特点介绍
蓝绿发布
概念定义:蓝绿发布是一种以最小的停机时间做服务升级的策略。 需要维护的两个版本的环境分别称为 “蓝环境” 和 “绿环境”。一般当前生产流量指向环境为绿环境,而在蓝环境上部署新版本,短时间内作为测试环境。
发布流程: 首先将一半的服务流量从负载均衡列表中移除,并且更新服务版本,验证新版本没有问题后,将生产流量指向蓝环境,然后对于老版本的绿环境进行版本升级,最后将所有服务流量加回负载均衡。
特点:
-
升级过程无需停机,用户感知小
-
升级过程一半资源提供服务
-
升级 / 回滚速度快
-
如果出了问题,影响面较广
红黑发布
概念定义:与蓝绿发布类似,红黑发布也是通过两个环境完成软件版本的升级,将当前生产流量指向的环境称为红环境,新版本环境称为黑环境。
发布流程:需申请新资源用于部署黑环境,在黑环境部署新版本的服务;黑环境部署完成后,一次性将生产流量指向黑环境;释放红环境的资源。
特点:
-
升级过程无需停机,用户感知小
-
短时间内需要使用双倍资源
与蓝绿发布相比,红黑发布充分利用了云计算的弹性伸缩的优势,实现:
-
简化发布流程
-
避免在升级的过程中,由于只有一半资源提供服务,而导致的系统过载问题
灰度发布
概念定义:灰度发布属于增量发布,新老版本同时为用户提供服务。灰度发布的主要目的是保证系统的可用性。每一次的线上变更都无法保证系统 100% 的无 bug,所以变更后要在线上小范围验证,等没问题再全面放开。而金丝雀发布是灰度发布的一种实现。
金丝雀发布由来:以前矿工开矿,在下矿洞前需要检查下方是否有毒气,矿工们先会放一只金丝雀进去探是否有毒气体,看金丝雀能否活下来。
发布流程:在现有环境中部署少量服务的新版本(金丝雀),部署完成后,对线上流量进行监测,如果没有问题就对老版本服务进行全量升级。
特点:
-
用户体验影响小,灰度发布过程出现问题影响范围较小
-
新版本功能逐步发布,可以逐步评估新版服务性能、稳定性和健康状态
-
发布自动化程度不够,发布期间可能引发服务中断
滚动发布
在金丝雀发布基础上的进一步优化改进,是一种自动化程度较高的发布方式,用户体验比较平滑,是目前成熟型技术组织所采用的主流发布方式。
结合 Zadig 实践
Zadig 企业版推出蓝绿发布、金丝雀发布、分批次灰度等发布任务,下面主要介绍在 Zadig 上如何使用这几个发布任务。
蓝绿发布 / 红黑发布
使用条件
所要更新服务的 workload 需要满足以下条件:
-
workload 需要有一个 service 与之对应,并且 workload 的 labels 包含所有 service 的 selector labels。
-
workload 当前只支持 deployment 类型。
配置蓝绿发布
1. 新建工作流。访问 工作流 -> 新建工作流 -> 选择 发布工作流 。
2. 添加部署蓝绿环境任务。点击「+ 任务」,选择「部署蓝绿环境」任务并配置。
3. [可选] 添加验证任务,验证蓝环境质量是否符合上线要求。点击「+ 任务」,选择「通用任务」任务并配置。
4. 添加蓝绿发布任务。点击「+ 任务」,选择「蓝绿发布」任务并配置。
5. 点击工作流「保存」按钮,完成工作流配置。
执行蓝绿发布
1. 点击「执行」按钮,选择需要更新的实例及镜像。
金丝雀发布
使用条件
所要更新服务的 workload 需要满足以下条件:
-
workload 需要有一个 service 与之对应,并且 workload 的 labels 包含所有 service 的 selector labels。
-
workload 当前只支持 deployment 类型。
配置金丝雀发布
1. 新建工作流。访问 工作流 -> 新建工作流 -> 选择 发布工作流 。
2. 添加部署金丝雀任务。点击「+ 任务」,选择「部署蓝绿环境」任务并配置。
3. [可选] 添加验证任务,验证金丝雀版本是否符合上线要求。点击「+ 任务」,选择「通用任务」任务并配置。
4. 配置人工审核。点击「+ 阶段」,开启「人工审核」。
5. 添加金丝雀发布任务。点击「+ 任务」,选择「金丝雀发布」并配置。
6. 点击工作流「保存」按钮,完成工作流配置。
执行金丝雀发布
1. 点击「执行」按钮,选择需要更新的实例及镜像。
2. 工作流完成部署金丝雀和验证任务,等待人工审核。此时环境中已部署 1 个金丝雀实例,如下图所示。
3. 人工审核通过并完成金丝雀发布。此时环境已更新为金丝雀版本,如下图所示。
分批次灰度发布
灰度发布有很多种实现方式,除了金丝雀发布,Zadig 还支持分批次灰度发布,按照实际情况,分多次升级线上服务,比如第一次灰度 20%,将生产 20% 流量打入新版本,通过监控观测线上流量情况,第二次灰度 40% ,观测流量,没问题后全量上线。
配置灰度发布
1. 新建工作流。访问 工作流 -> 新建工作流 -> 选择 发布工作流 。
2. 添加「灰度回滚」任务。点击「+ 任务」,选择「灰度发布」任务并 首个灰度任务 配置。
3. 添加更多灰度阶段,配置 非首个灰度任务 任务。
执行灰度发布
1. 点击「执行」按钮,选择需要灰度的容器及其镜像。
2. 工作流按照设置的任务完成执行,执行状态如下图所示。
Zadig,开放,链接,专业。