华为云应用运维管理平台获评中国信通院可观测性评估先进级

华为,应用,管理,平台,获评,中国,信通,可观,测性,评估,先进 · 浏览次数 : 44

小编点评

##华为云应用运维管理平台已获得中国信通院可观测性评估先进级! 华为云应用运维管理平台在中国信通院的“稳保行动”可观测性平台能力评估中取得了先进级成绩。该平台满足云上软件系统稳定-可观测性平台技术要求,成为业内领先的云应用运维管理平台。 **华为云应用运维管理平台的技术特点:** * **全面监控:**通过多个数据源的监控,全面掌握应用、资源及业务的实时运行状况。 * **智能分析:**提供云监控服务、日志分析、问题诊断等功能,帮助用户快速发现问题并进行有效解决。 * **开源集成:**支持多种开源生态,与各种工具和框架集成,方便用户进行定制化管理。 **华为云应用运维管理平台的优势:** * 提升软件系统的质量和效率 * 提升用户体验 * 优化业务流程和方向 * 提高业务决策的质量 **总结:** 华为云应用运维管理平台是业内领先的云应用运维管理平台,能够帮助企业提升软件系统的稳定性和安全性,以及提升用户体验。

正文

摘要:经过中国信通院的检验,华为云应用运维管理平台满足云上软件系统稳定-可观测性平台技术要求,达到了可观测性平台技术检验的先进级水平。

本文分享自华为云社区《华为云应用运维管理平台获评中国信通院可观测性评估先进级!》,作者:华为云PaaS服务小智。

近日,华为云应用运维管理平台参与了中国信息通信研究院(以下简称“中国信通院”)主办的“稳保行动”的可观测性平台能力评估。经过中国信通院的检验,华为云应用运维管理平台满足云上软件系统稳定-可观测性平台技术要求,达到了可观测性平台技术检验的先进级水平。

作为云计算和软件的权威评估机构,中国信通院在可观测性平台和工具的评测中,以通信行业标准《可观测性平台技术要求》为依据,客观真实地评估了厂商的可观测能力水平。经中国信通院的细致评估,华为云应用运维管理平台在数据采集、数据处理、数据应用、平台运维这4项检验中,满足了可观测性平台先进级能力要求,这也意味着华为云在可观测性领域已经达到业内领先水平。

图1 可观测性平台能力

华为云应用运维管理平台是云上应用的一站式立体化运维管理平台,实时监控应用及相关云资源,采集并关联资源的各项指标、日志及事件等数据共同分析应用健康状态,提供灵活的告警及丰富的数据可视化功能,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况。

图2 华为云应用运维管理平台

一、牢固的基石——应用资源管理和采集管理

应用资源管理

传统信息技术基础设施库(Information Technology Infrastructure Library,简称ITIL)流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。华为云应用运维管理平台的应用资源管理(简称CMDB)是基于DevOps理念打造的面向应用全生命周期的资源管理平台,是现代自动化运维的基石服务,统一集中管理资源对象与应用之间的关系。

应用资源管理CMDB以应用为中心,实现多层级应用、子应用、组件到环境的模型管理,建立应用与云资源依赖关系。通过应用资源管理,可以找到应用与下级微服务以及部署在不同环境(开发环境、测试环境或生产环境等)下的资源实例,包括ECS、RDS、ELB、CCE等云服务实例,为应用监控、告警关联分析以及自动化运维提供配置数据。同时也支持通过开放配置数据接口,辅助第三方系统运维场景建设。

图3 应用资源管理能力示意

采集管理

作为数据的来源,采集插件至关重要。华为云应用运维管理平台提供无侵入式采集插件,用户无需修改应用代码,只需要部署探针包,修改相应的应用启动参数,就能对应用进行全方位的数据采集,以便全面掌握应用的运行情况,采集范围包括但不限于:

  1. 基础资源:包含云主机、容器、网络等;
  2. 中间件:包含数据库、消息队列、应用容器、存储、日志等;
  3. IOT设备:包含各种边缘设备、采集的数据范围包括指标等;
  4. 前端组件:包含H5、ios、android、小程序等;
  5. 后端组件:包含java、python、nodejs、c#、go等。

另外华为云应用运维管理平台还提供插件生命周期管理能力,不同的插件分工采集不同的数据,用户可以按需安装、升级、卸载各类插件。

二、强大的核心——指标监控、云日志、应用性能管理

随着云原生技术逐渐普及,传统监控系统正朝可观测性系统演进,业界对可观测性的共识,是基于可观测性的三大支柱“metrics、logging、tracing”。

华为云应用运维管理平台将云监控服务(Cloud Eye,简称CES)的指标数据、云日志服务(Log Tank Service,简称LTS)的日志数据、应用性能管理服务(Application Performance Management,简称APM)的性能分析数据进行统一监控,从而提供了对云资源、应用和性能的全面监控和诊断。

指标——云监控服务CES

云监控CES是华为云上资源监控的服务,提供80多种云服务、上千类资源指标,涵盖弹性云服务器、带宽、数据库等服务,满足用户各类云上资源监控需求。CES可提供多聚合方式、最长六个月的历史监控图表,方便用户查看近半年业务监控数据。

除了云监控提供的云服务指标外,用户还可以自定义上报业务指标,通过Open API、SDK方式上报,可更全面、深入地监控业务运行状况。

日志——云日志服务LTS

在海量数据的时代,让宝贵的原始日志数据躺在磁盘里日渐沉寂,无法在云时代“一展宏图”,完全是埋没了日志数据的价值。而使用华为云日志服务就可以从项目初始便赋予日志数据搜索、分析和探索能力,让日志数据活起来、变有用。华为云日志服务提供日志采集、秒级搜索、海量存储、结构化处理、转储和可视化图表等各项能力,可满足应用运维、可视化分析、等保合规等各类应用场景。

场景1日志分析、保障系统安全:实时收集系统产生的日志数据,对日志数据进行分析、归档,支持每天百TB级日志的接入,十亿级日志秒级搜索

场景2日志审计:通过实时收集日志,避免数据被误删和被非法入侵者删除的可能性,同时将日志转储长期存储,满足合规要求

场景3 问题诊断:系统出现问题或故障时,通过日志快速查询、精准定位问题所在

场景4 系统改进:通过阻塞记录发现站点性能瓶颈,优化缓存策略、数据传输策略

图4 日志服务示意图

性能——应用性能管理服务APM

在华为内部,有上百万微服务使用着应用性能管理服务APM,在日常性能诊断、故障定位和排查等场景中,通过使用APM实现故障1分钟感知、5分钟定界、10分钟恢复能力的构筑。APM有力地支撑了华为云、终端、车、能源等各类型产品的应用性能管理和日常运维保障。

现在,华为云将内部多年积累的应用性能管理能力沉淀到华为云应用性能管理服务APM上,向云上用户提供端到端的全链路性能管理服务,包含前端监控、应用性能监控、全面拥抱开源生态,帮助用户在复杂的业务环境下快速发现应用性能问题,降低MTTR(平均故障恢复时长),全面掌控应用的性能健康状况。

图5 应用性能管理拓扑示意

三、丰富的周边能力——统一监控大盘、容器洞察、告警降噪

华为云应用运维管理平台除了牢固的基石及强大的核心,还提供了丰富的周边能力。

统一监控大盘

集中管理云监控、云日志、性能、Prometheus等多维度可观测性数据源,提供统一监控与分析,用户可以将来自不同数据源定义在一张监控大屏中显示,统一管理告警等。

图6 统一监控大盘示意

容器洞察

无缝对接华为云云容器引擎CCE,基于原生Kubernetes容器和集群模型,用户可通过Cluster、Namespace、Deployment、POD和Container进行逐步运维分析,包括Prometheus监控、日志和性能管理等;支持将Promethues服务器远程接入(Remote-Write)到华为云应用运维管理平台,还可通过PromQL查询原生指标并配置告警。

图7 容器洞察示意

告警降噪

华为云应用运维管理平台的告警降噪功能,提供分组、抑制和屏蔽告警降噪策略,大大减少了运维人员需要关注的告警量,增加了关键告警、高优先级问题的关注度,突出告警的重点问题,提高告警的可靠性,减少误判和漏警的情况,节省了人力和时间成本,提高了工作效率,有效保障系统的稳定性和安全性。

图8 告警降噪示意

如果软件系统内部情况都不可观测,更无从谈起故障分析和系统改进等稳定性保障手段。依托牢固的基石、强大的核心及丰富的周边能力,华为云应用运维管理平台助力企业提高软件系统的质量和效率,提升用户体验和关键业务的稳定性,优化业务流程和方向,提高业务决策的质量。

 

点击关注,第一时间了解华为云新鲜技术~

与华为云应用运维管理平台获评中国信通院可观测性评估先进级相似的内容:

华为云应用运维管理平台获评中国信通院可观测性评估先进级

摘要:经过中国信通院的检验,华为云应用运维管理平台满足云上软件系统稳定-可观测性平台技术要求,达到了可观测性平台技术检验的先进级水平。 本文分享自华为云社区《华为云应用运维管理平台获评中国信通院可观测性评估先进级!》,作者:华为云PaaS服务小智。 近日,华为云应用运维管理平台参与了中国信息通信研究

海量数据运维要给力,GaussDB(for Cassandra)来助力

摘要:应用运维管理平台(AOM)和Cassandra是两个不可分割的组成部分,它们共同构成了一个高效的解决方案,可以帮助企业在应用运维业务上取得巨大的优势。在这篇文章中,我们将介绍AOM和Cassandra的优势和特点,揭晓它们如何为企业保持市场竞争力的秘密。 本文分享自华为云社区《海量数据运维要给

一图看懂CodeArts Inspector 三大特性,带你玩转漏洞管理服务

华为云漏洞管理服务CodeArts Inspector是面向软件研发和服务运维提供的一站式漏洞管理能力,通过持续评估系统和应用等资产,内置风险量化管理和在线风险分析处置能力,帮助组织快速感应和响应漏洞,并及时有效地完成漏洞修复工作,更好地应对潜在的安全威胁。

云图说丨初识云应用引擎CAE

摘要:开发运营一个应用软件,面临种种挑战:软件栈厚重、开发上线慢、资源易浪费、运维投入高、突发流量应对困难。 华为云应用引擎CAE面对挑战,一扫而光!! 本文分享自华为云社区《【云图说】 | 第266期 初识云应用引擎CAE》,作者: 阅识风云。 CAE(Cloud Application Engi

华为云云原生视窗:一文回顾Q1精彩瞬间

摘要:一文速览2023年Q1期间华为云云原生相关动态信息。 华为云云原生动态 华为云海外首发CCI Serverless容器服务 在MWC23 巴展期间,华为云海外首发CCI Serverless容器服务正式上线。其具备聚焦应用免运维、极致计算性能、智能统筹弹性等优势…… Serverless容器构

云原生容器高可用运维能力应用

摘要:华为云容器SRE在海量集群和容器运维实践中,从智能运维能力、确定性场景恢复等多方面总结出一套确定性运维实践,以应对云原生业务快速增长。 本文分享自华为云社区《云原生容器高可用运维能力应用》,作者:陈勇/刘志超/袁文峰。 云原生场景下,对架构高可用、应用高可用、基础云平台高可用提出了更高的要求,

详解GaussDB(DWS)用户监控原理及应用

摘要:本文将聚焦于用户监控的原理及应用进行介绍。 本文分享自华为云社区《GaussDB(DWS)监控工具指南(二)用户级监控》,作者:幕后小黑爪 。 前言 资源监控是整个运维乃至整个产品生命周期重要的一环,事前及时语句发现故障,事后提供详实的数据用于追查定位问题。GaussDB(DWS)整个资源监控

山歌寥哉!生产制造系统需要新治理框架

基于统一的数据与应用平台底座构建一体化的业务应用同时在框架层面进行分层扩展,可真正解决MES/MOM类生产系统不同业务模块间可高效紧密协同,以及系统可快速定制、低成本可持续升级运维的问题。

云服务过载控制的前世今生

摘要:服务过载在云时代是必然存在的,如何解决与应对成为了云服务开发、运营与运维的关键要素,通过过载场景现象、基础过载控制等能力,来应对出现的服务/应用过载。 本文分享自华为云社区《云服务过载控制的前世今生》,作者:SRE确定性运维 。 1.为什么会有过载? 过载,是服务或应用处理的请求超过了自身所能

教你处理数仓慢SQL常见定位问题

摘要:通常在运维监控出现CPU使用率较高、P80/P95指标较高、慢SQL数量上升等现象,或者业务出现超时报错时,优先应排查是否出现慢SQL。 本文分享自华为云社区《GaussDB慢SQL常见定位处理手段》,作者:酷哥。 关键指标 通常在运维监控出现CPU使用率较高、P80/P95指标较高、慢SQL