硬核案例分享,一文带你拆解PHP语言体系下的容器化改造

php · 浏览次数 : 6

小编点评

本文主要介绍了华为云社区关于PHP语言体系应用现代化改造的成功案例——夺冠集团应用现代化改造。文章首先概述了夺冠集团的背景和业务场景,然后分析了客户面临的业务痛点,并提出了基于华为云的解决方案。接着,详细描述了容器化改造、Apollo配置中心、流量监控弹性伸缩等方面的具体实施步骤和优势。最后,总结了架构改造给客户带来的价值,并给出了相关参考文献。 1. **背景介绍**: - 描述了夺冠集团作为河南头部互联网企业的业务领域和产品线。 - 指出了客户面临的应用系统弹性伸缩慢和资源利用率低的问题。 2. **业务痛点分析**: - 分析了客户业务发展的需求和现有IT架构的不足。 - 指出了服务扩缩容效率不高和运维效率瓶颈的原因。 3. **云化架构升级改造方案**: - 提出了基于华为云的容器化方案、Apollo配置中心方案、流量监控弹性伸缩方案等。 - 详细介绍了这些方案如何解决客户的具体问题。 4. **架构改造成果**: - 展示了改造前后在弹性伸缩时间、镜像存储、性能优化等方面的显著改进。 - 强调了架构改造给客户带来的价值,包括提高运维效率、降低存储成本和提高业务稳定性。 总的来说,文章通过夺冠集团的案例,展示了如何通过华为云的技术和服务帮助传统PHP应用实现现代化改造,从而提升企业的竞争力和市场响应速度。

正文

本文分享自华为云社区《PHP语言体系下的容器化改造,助力夺冠集团应用现代化》,作者: HuaweiCloudDeveloper。

1、摘要

本文主要介绍了PHP语言体系应用现代化改造上云的案例。PHP在互联网公司应用广泛,PHP语言体系下的容器化改造与常见的Java语言存在一定差异,本文以夺冠集团的应用场景为背景,提供了PHP语言应用的容器改造案例,通过容器化、OPCache技术、Apollo配置中心等方案解决了弹性伸缩慢、资源利用率低、配置混乱等问题,完成生意兔等应用的华为云迁移、现代化改造等工作,效率和存储利用率提升了数倍以上。

2、背景

夺冠集团是河南头部互联网企业,致力于运用小程序产品技术,为商家和企业提供“互联网营销+数字化经营”一体化商业解决方案。夺冠集团旗下拥有夺冠魔方、生意兔、海豚知道、夺冠生活圈、小魔推、船到、小镇外卖、创意兔等众多产品线和完善的售后服务体系。近年来,夺冠凭借过硬的产品技术与服务品质在国内脱颖而出,与阿里、百度、腾讯、字节跳动等一线互联网企业均保持紧密合作。

夺冠集团应用开发以PHP语言为主,业务多样化,代表处通过多次交流均未能从商务上打动客户。DTSE介入后,针对客户业务上的痛点问题,对客户进行了深入的调研,并为客户提供了基于华为云的应用现代化改造方案,成功打动客户CTO及高层领导,获得应用现代化改造的试点机会。

3、客户业务场景分析

3.1 业务痛点

在与客户的交流中,客户表示业务最近几年可见较大的发展机会,且业务发展对资源消耗较大,但是客户业务系统的IT架构无法支撑未来业务发展,最主要的问题是弹性伸缩效率不高,会因为突发流量导致系统崩溃,同时运维效率存在瓶颈。

面对客户提出的问题,DTSE经过深入调研分析,客户的IT系统问题主要以下两个原因导致的,一是在服务扩缩容方面,客户应用直接在服务器部署,基于服务器的备份镜像做弹性伸缩,镜像大小高达200G,即浪费了弹性伸缩时间,又增加了存储成本;二是在突发流量感知方面,客户基于系统负载、CPU利用率和内存利用率进行负载监控,此类指标只有业务流量实际处理起来后才会发生变化,对于流量感知是滞后的,故不能及时的感知到突发流量。

对于运维效率方面,客户随着业务的发展,现有的运维人员已经不能满足业务运维需要,正在招聘多名运维人员。经过与运维开发同事的交流,主要是由以下两个原因导致了运维人员的效率低下,一是客户开发和运维边界混乱,很多开发环节的操作都需要运维介入,比如业务系统新版本的上线、测试环境配置的更新、日志的收集查找等等;二是客户的多个应用混合部署在多台服务器上,对应关系完全靠人工维护,且应用配置杂乱无章,完全依赖手工管理和同步。

  • 在调研过程中,还发现客户的应用系统还存在以下问题:
  • 应用间耦合部署,当发生突发流量、受到攻击时,会发生资源相互争抢等现象。
  • 未处理好弹性伸缩后,新扩容应用的负载均衡问题。
  • 应用和数据的灾备机制不健全,可靠性低。
  • PHP应用执行效率低下。

3.2 客户改造阻塞点

与客户领导沟通时,客户对于应用架构升级非常感兴趣,但是对于业务升级还是有比较大的担忧,主要在以下三个方面:首先客户希望架构升级不能给业务带来的影响;其次希望架构升级后,尽量避免对于现有开发人员技术栈的冲击;第三,希望尽量减少架构升级所带来的额外成本。考虑到企业业务稳定发展、企业技术栈与人员稳定性,客户对于升级改造存在较大的疑虑。

4 、云化架构升级改造方案

综合考虑业务问题与客户关注问题,项目组决定采用以样板改造先行,打消客户疑虑,以样板效果推动项目发展的应对策略。

4.1 改造样本选择

分析客户业务体系,当前有约20个应用,全景图如图1所示,各个应用之间的技术栈基本相同。

与客户共同商讨,建议采用循序渐进的策略,先试点后复制推广,与客户沟通后决定先选择标杆应用进行架构优化试点。

同时为了保证业务稳定,我们计划先测试后生产,提高改造效率,尽快完成试点,划定业务改造范围,为了客户体验,优先改造不需要开发人员参与的部分,对业务影响小的部分,保证改造过程平稳,其余部分则只在测试环境上优化,并由客户决定是否上生产环境。

cke_114.png

图1 夺冠集团应用技术架构全景图

针对客户关心的三个具体问题,DTSE提供了不停机的切换方案,保证架构升级的业务连续性。同时,加强客户沟通,通过高层汇报、日常项目例会为客户决策层、具体项目执行层详细说明了新架构对于开发技术栈要求不变的特点。重点介绍了新架构所能带来的资源利用率的提升,减少客户对于成本的担忧。通过技术与日常项目运作,让客户整体上消除了对于新技术带来挑战的顾虑,坚定了对改造项目的支持。

4.2 PHP容器化遇到的问题

夺冠集团所有应用的后端都是PHP语言实现的,基于PHP-FPM运行,主要有以下特点:

  • 客户应用每次请求都是一个进程,且会依次执行扫描、解析、编译,最后才会执行代码,故资源使用量极高。
  • 客户应用中的大部分进程都实现了无状态化,但是往往多个进程的代码会混杂在一起,难以拆分。
  • 客户在程序设计时,并未考虑此应用需要在云上运行,不符合云原生要素要求,因此,还有部分进程是有状态的。
  • 客户在上线新版本时,采用远程FTP的方式直接修改测试环境代码,采用git拉取的方式更新生产环境代码。

因此,对于夺冠集团的业务改造,也不单单是容器化这么简单,我们需要从业务到流程,全面的对于夺冠的应用进行改造,这并不是一个简单的事情。

4.3 应用改造方案

针对客户应用存在的痛点和问题,项目组提供了基于华为云的应用现代化改造方案,整体方案如图2所示。包括基于CCE和CCI的容器化方案、基于Apollo配置中心方案、基于流量监控的弹性伸缩方案等多个子方案。此方案优点是:

  • 应用集群基于CCE服务做容器化、无状态部署,资源相互隔离,避免相互抢占影响的现象。
  • 配置统一管理,可管、可控、可视,不再需要人工手动维护,提升运维效率。
  • 基于流量的弹性伸缩,提前感知流量变化,提高弹性伸缩反应时间。
  • 应用集群通过NAT网关实现对外部三方服务的访问,单IP外置化,不再与集群强耦合。

cke_115.png

图2 夺冠集团应用现代化改造方案

4.3.1 基于CCE和CCI的容器化方案

客户在服务器上部署的应用镜像高达200G,且多个应用混杂在同一个镜像中,所以我们并没有选择直接将应用镜像进行容器化的方案,而是对客户的业务流程进行了详细的分析和拆解,尽量将每个镜像做到最小。

以生意兔应用为例,其业务的部署架构如图3所示。

cke_116.png

图3 生意兔的部署架构

我们将生意兔的nginx路由拆出,并由k8s提供的nginx ingress替换,然后将WorkerMan的网关和注册中心拆出,剩余的生意兔业务相关的部分,因为代码耦合所以暂时部署在同一个容器中,等待客户开发人员将各个进程的代码剥离开,即可分开独立部署。最终客户业务镜像被缩减到了180M,且配合CCE和CCI,实现了秒级扩容。

在项目过程中多次因为业务流程未对齐而修改方案的情况发生,主要是因为客户对于容器化并没有清晰的概念,并不清楚那些问题会影响容器化的方案,所以建议在进行改造前对于客户开发和运维人员进行一次简单的赋能,便于问题提前暴露。

4.3.2 基于Apollo配置中心方案

对于客户配置混乱的问题,DTSE给客户提供了基于Apollo的配置中心方案,页面化操作,一键修改所有负载的配置,不再需要运维人员手动的维护。如图4所示,且Apollo也是采用容器化部署,搭建方便,如图3所示。

cke_117.png

图4 基于Apollo的配置中心方案

针对测试和生产环境,我们为客户分别部署了两套独立的环境,测试环境直接将账号提供给开发测试人员,可以由测试人员直接修改环境配置,不再需要运维参与,而生产账号由运维人员控制,并只允许运维人员修改。

4.3.3 基于流量监控的弹性伸缩方案

为了进一步解决客户弹性伸缩慢的痛点,DTSE提供了基于Prometheus流量监控的弹性伸缩方案,如图5所示。相较于通用的资源使用率做弹性伸缩,直接利用容器的网络监控数据作为弹性伸缩指标,在突发流量到来的时候更早的感知到负载的变化,更加迅速的触发弹性伸缩。基于此方案我们将客户最终弹性伸缩的时间缩短了一倍有余。

cke_118.png

图5 基于基于Prometheus流量监控的弹性伸缩方案

4.3.4 基于CodeArts的CICD方案

为了进一步解决客户运维效率低的问题,DTSE提供了基于CodeArts的CICD方案,如图6所示,建立从代码到部署的流水线,由客户开发人员自行进行新版本发布,让运维和开发人员职责归位。

cke_119.png

图6 基于CodeArts的CICD方案

并推荐客户结合业界最佳实践,在一段有限的时间内,逐步将代码QC、代码门禁、自动化测试等配置加入流水线,进一步提高自动化程度,进而提高交付质量。

4.3.5 PHP性能优化方案

针对客户PHP应用运行效率低下问题,我们发现主要是因为客户没有使用OPCache技术导致的,因为在客户原有的环境中,使用OPCache会导致新发布的版本需要三到五分钟才能生效,不利于开发和测试,所以也没有在公司内部推广,但是在容器化之后,则无需担心缓存问题,OPCache加速的原理如图7所示,使用OPCache技术可以为应用带来4倍多的性能提升。

cke_120.png

图7 OPCache加速的原理

4.4 对云服务产品的意见

对于客户关注的弹性伸缩问题,我们测试发现,当前CCE突发弹性到CCI还需要20多秒的时间,其中180M的镜像加载占用了13s,建议产品对于镜像加载过程进行优化,进一步缩短突发弹性扩容时间。

对于客户关注的成本问题,通常采用CCE和CCI配合的方案,由于CCE节点池扩容较慢,在此期间突发扩容到CCI,为了进一步减少客户成本,建议产品增加此场景的调度功能,当CCE有充足的资源时,主动将CCI上的容器调度到CCE上。

当前CodeArts Build虽然可以编译容器镜像,但是对于基础环境镜像支持不足,在很多基础环境镜像的编译时会按照很多基础组件比如make等等,会需要较高的权限,但是CodeArts Build官方环境,会因为缺乏权限而导致构建失败。

4.5 架构改造给客户带来的价值

指标

优化前

优化后

对比

备注

弹性时间

140s ~ 210s

51s ~ 81s

2倍+

从突发流量到伸缩完成

镜像存储

200G

0.18G

1000倍+

节省存储空间,提升部署速度

性能优化

RPS 14.2

RPS 61.56

4倍+

3Core6G 100并发

配置管理

600s+

20s

30倍+

无需运维人工介入

应用容灾

单可用区

多可用区

 

提升抗风险能力

环境一致性

不一致

一致

 

减少问题出现概率

隔离性

耦合部署

独立部署

 

避免了相互挤压

流水线

单部署

从代码到部署

 

从代码到部署一条流水线

5、总结和建议

根据W3 Techs的统计,PHP仍然是当今使用最广泛的服务器端语言,仍然作为互联网的主干,为至少百分之七十的网站提供后端支持[1]。尤其是在中小企业类互联网公司,PHP仍被大量使用,通常这类企业存在技术升级力量储备弱、应用架构历史债务重等问题。

牵引这类客户上云,简单的商务折扣已经难以打动,而平滑过渡的升级方案、全栈云的技术支持对其更加具有吸引力。由DTSE提供方案建议和技术支持,引导客户进行试点验证,进而推广复制,并保障业务改造的平滑过度,循序渐进的将客户业务迁移上华为云,实现客户与华为云双赢。

本文介绍了PHP语言体系应用现代化案例,实现了许多与业务无关的通用性应用改造方案,如PHP应用容器化架构方案、基于Prometheus的弹性伸缩方案等等,为此类型客户提供了一个可参考的案例。

6、参考文献

[1] https://timotijhof.net/posts/2023/an-internet-of-php/

 

点击关注,第一时间了解华为云新鲜技术~

 

与硬核案例分享,一文带你拆解PHP语言体系下的容器化改造相似的内容:

硬核案例分享,一文带你拆解PHP语言体系下的容器化改造

本文介绍了PHP语言体系应用现代化案例,实现了许多与业务无关的通用性应用改造方案,如PHP应用容器化架构方案、基于Prometheus的弹性伸缩方案等等,为此类型客户提供了一个可参考的案例。

基于随机森林算法进行硬盘故障预测

摘要:本案例将带大家使用一份开源的S.M.A.R.T.数据集和机器学习中的随机森林算法,来训练一个硬盘故障预测模型,并测试效果。 本文分享自华为云社区《基于随机森林算法进行硬盘故障预测》,作者:HWCloudAI 。 实验目标 掌握使用机器学习方法训练模型的基本流程; 掌握使用pandas做数据分析

[转帖]Nginx应用调优案例

https://bbs.huaweicloud.com/blogs/146367 【摘要】 1 问题背景nginx的应用程序移植到TaiShan服务器上,发现业务吞吐量没有达到硬件预期,需要做相应调优。 2 原因分析l 网卡配置该应用场景下网络吞吐量大,网卡的配置能对性能提升起到很大的作用。l 操作

[转帖]Nginx应用调优案例

https://bbs.huaweicloud.com/blogs/146367 【摘要】 1 问题背景nginx的应用程序移植到TaiShan服务器上,发现业务吞吐量没有达到硬件预期,需要做相应调优。 2 原因分析l 网卡配置该应用场景下网络吞吐量大,网卡的配置能对性能提升起到很大的作用。l 操作

【转帖】eBay 流量管理之 Kubernetes 网络硬核排查案例

https://www.infoq.cn/article/L4vyfdyvHYM5EV8d3CdD 一、引子 在 eBay 新一代基于 Kubernetes 的云平台 Tess 环境中,流量管理的实现逐步从传统的硬件 Load Balancer 向软件过渡。在 Tess 的设计中,选用了目前比较流行

nordic——long range测试

简介:本案例测试了long range,注意nrf52系列芯片中,部分硬件是不支持CADED的,因此也就是不支持long range,如nrf52832就不支持long range。同时协议栈也是部分支持,部分不支持,支持的如S140,不支持的如S113.所以在开发前需要把软件和硬件都确定好。 测试

缓存空间优化实践

缓存Redis,是我们最常用的服务,其适用场景广泛,被大量应用到各业务场景中。也正因如此,缓存成为了重要的硬件成本来源,我们有必要从空间上做一些优化,降低成本的同时也会提高性能。下面以我们的案例说明,将缓存空间减少70%的做法。

「硬核」实操如何拥有一个自己的数字人模型

本文大致分为三个章节: 第一部分会介绍常用技术以及简介,以及自己用到构建一个自己虚拟数字人用到的3D引擎和三维软件 第二部分会详细描述生成细节,通过照片建模,创建模型,添加细节,添加表情,优化效果,接入场景,最终效果 第三部分总结本篇内容

CANN 6.0来了,硬核技术抢先看

摘要:在华为全联接大会2022期间,华为正式官宣昇腾AI异构计算架构CANN 6.0版本将在年底正式发布。 本文分享自华为云社区《昇腾AI异构计算架构CANN 6.0全新开放升级,全面释放AI生产力》,作者: 昇腾CANN 。 在华为全联接大会2022期间,华为正式官宣昇腾AI异构计算架构CANN

[转帖]“炫技”还是“真硬核”,OpenPPL 实测阿里「倚天 710」芯片

“炫技”还是“真硬核”,OpenPPL 实测阿里「倚天 710」芯片 本文将以「深度学习模型推理应用」为出发点,对「倚天 710」这款 ARM Server 芯片进行性能实测。 OpenPPL 自开源以来,便密切关注着业界的进展,致力于优化模型推理的全链条。完善对国产化芯片的支持,是 OpenPPL