人工智能如何应对 DevOps 监控和可观测性挑战

人工智能,如何,应对,devops,监控,可观,测性,挑战 · 浏览次数 : 45

小编点评

**人工智能如何通过分析日志和指标来预测潜在的系统故障或性能下降?** 人工智能可以分析历史数据,检测持续集成阶段的异常情况。在进入下一阶段之前,任何异常变更都会被标记为审查对象。例如,IBM Watson Anomaly Detection 工具可以通过使用人工智能来检测模式和异常,从而帮助识别这些异常。 **人工智能如何帮助实现主动维护和问题解决?** 人工智能可以帮助优化持续集成 (CI) 中测试用例的选择。利用历史测试数据,人工智能可以确定哪些测试用例最有可能发现新缺陷。 **人工智能如何帮助实现自动回滚?** 在持续部署的情况下,AI 可用于自动回滚导致导致问题的部署。Harness 等工具使用机器学习来了解典型的应用程序行为,如果检测到异常,则会自动恢复到最后的稳定状态。 **人工智能如何帮助实现基础设施优化?** AI 可帮助优化云环境中的资源使用。CAST.AI 和 Turbonomic 等工具可以利用人工智能持续优化基础架构,确保在降低成本的同时提高性能。 **人工智能如何帮助实现事件管理流程自动化?** AI 帮助实现从检测到解决的事件管理流程自动化。BigPanda 和 Moogsoft AIOps 等工具使用人工智能来汇总、关联和分析来自不同来源的警报,从而减少噪音并加快事件解决速度。

正文

自 ChatGPT 横空出世之后,AIGC 已成为不可逆转的时代浪潮。在之前的文章中,我们介绍了DevOps 领域中AI的用例,需要回顾可以点击下方链接。在本篇文章中,我将简单聊聊人工智能(AI)如何通过分析日志和指标来预测潜在的系统故障或性能下降,从而实现主动维护和问题解决。
 

持续监控和可观测性用例

CI 异常检测:人工智能可以分析历史数据,检测持续集成阶段的异常情况。在进入下一阶段之前,任何异常变更都会被标记为审查对象。像 IBM Watson Anomaly Detection 这样的工具可以通过使用人工智能来检测模式和异常,从而帮助识别这些异常。
 

代码质量保证:在开发阶段可以使用人工智能来分析代码以确保其质量,有助于减少错误和漏洞。DeepCode 和 Codota 等工具会使用 AI 来识别潜在问题,并根据学习的代码和解决方案数据库提出改进建议。
 

测试用例优化: AI 可以帮助优化持续集成(CI)中测试用例的选择。利用历史测试数据,人工智能可以确定哪些测试用例最有可能发现新缺陷。Testim.io 等工具可以根据风险和变更影响使用人工智能来确定测试的优先级,从而帮助实现这一目标。
 

CD 中的预测分析:AI 可以分析历史部署数据并预测持续交付 (CD) 期间的潜在问题。这可以帮助先发制人地解决问题,减少停机时间。Splunk 等工具使用人工智能和机器学习来为运营数据提供预测分析。
 

自动回滚:在持续部署的情况下,AI 可用于自动回滚导致问题的部署。Harness 等工具使用机器学习来了解典型的应用程序行为,如果检测到异常,则会自动恢复到最后的稳定状态。
 

基础设施优化: AI 可帮助优化云环境中的资源使用。CAST.AI 和 Turbonomic 等工具可以利用人工智能持续优化基础架构,确保在降低成本的同时提高性能。
 

事件管理:AI 帮助实现从检测到解决的事件管理流程自动化。BigPanda 和 Moogsoft AIOps 等工具使用人工智能来汇总、关联和分析来自不同来源的警报,从而减少噪音并加快事件解决速度。
 

日志分析:人工智能可以分析日志,找出人类难以发现的模式。Logz.io 等工具利用人工智能对日志数据进行认知洞察,从而提供对数据的更深入理解。
 

安全威胁检测:人工智能可以分析模式,更有效地检测安全威胁。Darktrace 等工具利用机器学习来实时检测异常行为,从而在潜在威胁造成破坏之前将其检测出来。
 

网络监控:人工智能可以通过分析流量模式预测网络中断。Kentik 等工具利用人工智能在影响用户之前主动识别潜在的网络问题。
 

将持续监控转变为使用人工智能时的挑战

以下是企业在过渡现有 CI/CD 流水线以将人工智能纳入持续监控和可观察性时可能面临的一些挑战,以及可能的解决方案:
 

数据质量和可用性:人工智能工程工具的有效性在很大程度上取决于所提供数据的质量和数量。数据不足或质量不佳会导致洞察力或预测不准确。实施有效的数据治理和管理实践可确保数据的质量和可访问性。数据应彻底清理并适当标注,以方便人工智能模型的训练。
 

技术差距:采用人工智能工程工具需要现有 IT 团队可能不具备的新技能。他们可能不了解如何有效地使用这些工具。为您的 DevOps 团队提供全面培训,弥补技术差距,还可以考虑聘请 AI 专家或与经验丰富的供应商合作,帮助实施和管理人工智能工具。
 

变革阻力:与任何重大转型一样,变革阻力也可能是一个巨大障碍。员工可能会担心工作保障或认为难以适应新工具。无论是在组织层面还是个人层面,都要清晰透明地宣传人工智能转型的好处。确保员工认识到,人工智能是用来帮助他们的,而不是取代他们。组织研讨会和培训课程,帮助员工轻松过渡。
 

与现有系统集成:人工智能工具需要与现有的 DevOps 工具和工作流程无缝集成,以确保在不影响运营的情况下增加价值。选择与现有基础设施兼容的人工智能工具,或考虑实施集成中间件。进行概念验证(PoC),确保新的人工智能工具顺利集成。
 

实施成本:部署人工智能工具可能需要大量的前期投资,包括工具本身和必要的基础设施升级。进行全面的成本效益分析,以了解人工智能工具所能带来的投资回报(ROI)。考虑从低成本或开源工具开始,或使用基于云的人工智能服务,以减少对基础设施的初始投资。
 

总 结

随着 DevOps 世界的发展,人工智能在监控和可观测性方面的整合变得越来越重要。无论是在持续集成、持续交付或持续部署阶段,还是在应用程序、基础设施和流水线阶段,人工智能都能带来非凡的效益。从 CI 中的异常检测、代码质量保证和测试用例优化到 CD 中的预测分析,人工智能可以改变您的运维,提供更快速、更可靠的结果。
 

然而,向人工智能优化的 DevOps 环境过渡并非没有挑战。必须考虑并解决数据质量、技能差距、变革阻力、系统集成和成本影响等问题。但不用担心,解决方案就在眼前。通过有效的数据治理、全面的培训、透明的沟通、明智的工具选择和彻底的成本效益分析,您可以应对这些挑战,并在 DevOps 之旅中收获人工智能带来的回报。准备好迎接 AI 驱动的 DevOps 的未来了吗?现在就开始探索各种可能吧。
 

参考链接:
https://devops.com/how-ai-addresses-devops-monitoring-and-observability-challenges/

与人工智能如何应对 DevOps 监控和可观测性挑战相似的内容:

人工智能如何应对 DevOps 监控和可观测性挑战

本文将为您介绍人工智能(AI)如何通过分析日志和指标来预测潜在的系统故障或性能下降,从而实现主动维护和问题解决。

Stack Overflow开发者调查发布:AI将如何协助DevOps

本文将重点介绍 Stack Overflow 发布的2023年度开发人员调查报告中的几项重要发现,即重要编程语言和工具偏好、人工智能在开发工作流程中的应用以及这些趋势对 DevOps 领域可能意味着什么。

NodeJS 实战系列:DevOps 尚未解决的问题

本文将通过展示 NodeJS 应用里环境变量的提取过程,来一窥 DevOps 技术是如何应用在现在云平台上的运维工作中的。同时我也想让大家在这里看到 DevOps 的另外一面,即它并非全能,从本地开发到持续部署再到实际运行,有一些运维鸿沟依然还未被填平。“人工操作”依然是工作中的最大风险。

【云享·人物】华为云AI高级专家白小龙:AI如何释放应用生产力,向AI工程化前行?

摘要:AI技术发展,正由应用落地阶段向效率化生产阶段演进,AI工程化能力将会不断深入业务,释放企业生产力。 本文分享自华为云社区《【云享·人物】华为云AI高级专家白小龙:AI如何释放应用生产力,向AI工程化前行?》,作者: 华为云社区精选。 在新科技革命和产业变革的大环境中,人工智能技术迭代和商业化

京东云开发者|经典同态加密算法Paillier解读 - 原理、实现和应用

随着云计算和人工智能的兴起,如何安全有效地利用数据,对持有大量数字资产的企业来说至关重要。同态加密,是解决云计算和分布式机器学习中数据安全问题的关键技术,也是隐私计算中,横跨多方安全计算,联邦学习和可信执行环境多个技术分支的热门研究方向。 本文对经典同态加密算法Pailier算法及其相关技术进行介绍,重点分析了Paillier的实现原理和性能优化方案,同时对基于公钥的加密算法中的热门算法进行了横向

AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践,复刻《遥远的歌》,原唱晴子(Python3.10)

忽如一夜春风来,亚洲天后孙燕姿独特而柔美的音色再度响彻华语乐坛,只不过这一次,不是因为她出了新专辑,而是人工智能AI技术对于孙燕姿音色的完美复刻,以大江灌浪之势对华语歌坛诸多经典作品进行了翻唱,还原度令人咋舌,如何做到的? 本次我们借助基于Python3.10的开源库so-vits-svc,让亚洲天

AI Agent框架(LLM Agent):LLM驱动的智能体如何引领行业变革,应用探索与未来展望

AI Agent框架(LLM Agent):LLM驱动的智能体如何引领行业变革,应用探索与未来展望 1. AI Agent(LLM Agent)介绍 1.1. 术语 Agent:“代理” 通常是指有意行动的表现。在哲学领域,Agent 可以是人、动物,甚至是具有自主性的概念或实体。 AI Agent

使用小波分析和深度学习对心电图 (ECG) 进行分类 mcu-ai低成本方案 mcu-ai低成本方案

具体的软硬件实现点击 http://mcu-ai.com/ MCU-AI技术网页_MCU-AI人工智能 此示例说明如何使用连续小波变换 (CWT) 和深度卷积神经网络 (CNN) 对人体心电图 (ECG) 信号进行分类。 从头开始训练深度 CNN 的计算成本很高,并且需要大量的训练数据。在很多应用中

.Net与AI的强强联合:AntSK知识库项目中Rerank模型的技术突破与实战应用

随着人工智能技术的飞速发展,.Net技术与AI的结合已经成为了一个新的技术热点。今天,我要和大家分享一个令人兴奋的开源项目——AntSK,这是一个基于.net平台构建的开源离线AI知识库项目。在这个项目中,我们最近加入了一项强大的Rerank(重排)模型,进一步增强了我们的AI知识库的查询能力。如果

ChatGPT API使用介绍

1.概述 随着人工智能技术的不断发展,越来越多的AI产品被应用到各个领域,其中最具代表性的莫过于人工智能语言模型。语言模型是一种可以通过学习大量语言数据来预测文本或语音的技术,其应用范围十分广泛,如智能客服、机器翻译、语音助手等。 而ChatGPT是其中最为优秀的语言模型之一。ChatGPT是Ope