摘要:近日,华为云全链路应用性能管理服务CodeArts APM全新上线,提供端到端的全链路性能管理服务,涵盖前端监控、应用性能监控,全面拥抱开源生态。
本文分享自华为云社区《企业应用可观测性利器!华为云CodeArts APM发布》,作者:华为云头条。
当前,企业数字化转型和业务互联网化逐渐加深,企业对应用的高可用、可靠性提出了更高的要求。随着企业快速引入云原生、微服务、分布式等技术,业务规模和运维管理对象数量成倍增加,服务之间的依赖、调用关系愈发复杂。一方面企业享受着开发效率指数提升的红利,同时也在承受着故障定位成本居高不下的痛楚。
由于传统的监控只覆盖了基础设施、中间件、业务指标相关的观测能力,缺少深入代码级的性能监控和对用户的真实体验感知,给开发者、运维性能分析、故障定位和恢复带来了极大的困难和挑战。
权威数据显示:每100毫秒延迟会使销售额下降1%,每一秒钟服务器延迟会导致收入下降2.8%。例如,某著名搜索服务结果页面从100毫秒放缓到400毫秒,会使收入流失4500万到1.35亿美元。由此可见,全面掌控、感知应用性能和用户体验已经变得愈发重要,甚至关系到商业公司生死存亡和社会影响。
近日,华为云全链路应用性能管理服务CodeArts APM全新上线,提供端到端的全链路性能管理服务,涵盖前端监控、应用性能监控,全面拥抱开源生态。
随着云原生技术逐渐普及,传统监控系统正朝可观测性系统演进,业界对可观测性的共识,是基于可观测性的三大支柱“metrics、logging、tracing”。其中应用性能管理形成了Tracing为核心的可观测性解决方案,作为企业可观测性产品选型的重要评估标准。
一款应用性能管理工具应当具备如下主要能力:
多语言支持:支持常用开发语言,涵盖java、php、go、node.js、python、.net、C++和主流应用框架。
无侵入式采集:用户无需修改应用代码,只需要部署探针包,修改相应的应用启动参数,就能对应用进行全方位监控。
自动发现应用间的调用关系:通过对调用信息进行动态分析、智能计算,自动生成分布式应用间调用关系。
调用链追踪:多个应用接入后,可自动针对某些请求进行采样,采集单个请求的服务之间调用关系以及中间调用的健康情况,实现全局调用链路的自动跟踪。
深入代码级的性能诊断:与传统监控系统不同,应用性能管理提供深入代码层面的应用性能剖析,无需开发人员或者运维人员到日志系统、甚至到真实的业务服务器上查看执行情况来解决问题。
全面准确的指标监控:可度量应用的整体健康状况,采集应用的各项性能指标,如服务间调用、异常、外部调用、数据库访问以及其他中间件的指标数据,帮助用户全面掌握应用的运行情况。
拥抱开源生态:基于OpenTelemetry标准,全面兼容各类开源生态,如Jaeger、Zipkin、SkyWalking。
感知终端用户的真实体验:对移动端App或Web的用户体验进行监控,涵盖所有移动端设备、浏览器以及小程序,了解终端用户真实体验感受,从而优化产品提升用户体验。
华为云CodeArts APM为华为内部百万微服务提供应用性能监控,帮助研发人员日常性能诊断、故障定位和排查,通过使用CodeArts APM实现现网故障1分钟感知、5分钟定界、10分钟恢复能力的构筑,有力的支撑了华为云、终端、车、能源等各类型产品的应用性能管理和日常运维保障。
现在,华为云将内部多年积累的应用性能管理能力沉淀到CodeArts APM,该工具具备5大特性:
华为云CodeArts APM提供全链路应用性能监控能力,涵盖前端监控、应用性能监控,实现前、后端链路的打通,完整还原用户的体验现场,为产品体验优化和问题定位指明方向。华为内部通过使用CodeArts APM,丰富问题排查手段,提升问题根因定位的效率,故障处理耗时减少45%。
华为云CodeArts APM对前端性能和用户体验数据进行多维度的可视化数据分析,包括页面加载性能、JS错误、API请求、服务流量,全面掌控终端用户的体验。通过华为云CodeArts APM,页面体验用时可优化至3S以内,被监控页面故障主动发现率从40%提升到90%,大幅降低用户页面体验的投诉率。
应用资源管理(CMDB)已被业界公认为运维解决方案的基石服务,华为云CodeArts APM通过应用、组件、环境的分层树形结构,清晰展示应用与资源的关系,并与华为云应用运维管理服务(AOM)协同,统一资源对象模型,有效管理海量分散资源,保障数据准确性和一致性,帮助企业解决运维难、变更难的问题。
华为云CodeArts APM可自动生成应用之间的访问拓扑图,发现应用、中间件、接口、实例间的调用关系和性能表现情况,异常问题清晰展现,帮助企业用户快速确定故障范围与影响,使得发现故障、问题定位时间从小时级降至分钟级,减少业务日常运维保障的压力。
华为云CodeArts APM自动为每次请求构筑完整的调用链访问路径,包含性能、代码堆栈、SQL语句等组件访问信息、相关的请求参数和性能指标数据,深入代码级的追踪帮助用户快速定位问题根因,为性能优化、故障处理提供详尽的数据支持。
得益于以上特性,华为云CodeArts APM如今已广泛应用于电力、物流、社保、汽车等领域,帮助企业提升用户体验,发现应用性能瓶颈,提升问题定位及处理的效率。
如深圳某知名物流企业通过使用华为云CodeArts APM,故障定位的平均耗时从120分钟降至5分钟,平均故障恢复时长从60分钟下降至10分钟,极大地提升了故障处理的效率,成为服务运维保障的利器。
未来,华为云CodeArts APM将不断沉淀大型企业应用性能管理的最佳实践,提供更丰富的应用性能管理特性,携手国内外客户、伙伴以及开发者,助力优化产品性能,共同提升问题定位及处理效率,打造卓越的数字化体验。