概述
使用智能体式 AI 解决方案重塑事件响应和卓越运营
帮助开发人员和站点可靠性工程师 (SRE) 通过一个协作的智能体减少警报疲劳,该智能体可在减少人工干预的同时保持系统可靠性。
- 通过将琐碎任务交给智能体处理,使工程团队能够专注于开发新功能和增强现有系统。自动执行重复和手动任务,例如全天候监控生产系统、实时响应事件,以及在出现问题时自动排查。
- 通过识别和缓解干扰,主动增强应用程序可用性。通过 Azure SRE 智能体最大程度降低停机成本并缩短平均修复时间 (MTTR)。在人工监督下,SRE 智能体可学习并帮助快速解决新出现的问题。
- 通过能够自动化执行监控、事件响应和根本原因分析的 SRE 智能体,优化云环境中的资源使用,减少浪费并降低运营成本。
功能
借助智能自动化,提升运营团队的影响力
加速根本原因分析
针对应用、平台和基础结构,实现深度、多层级调查的自动化。SRE 智能体可关联遥测数据、验证假设并清晰阐释根本原因,从而缩短平均修复时间 (MTTR),减少值班运维的繁琐工作,还能大规模提供一致的专家级诊断。
增强事件响应
从每次事件中捕获并复用运营知识。SRE 智能体可实时呈现过去的解决方案、运行手册和学到场景信息,帮助团队避免重复工作、消除盲点,且随着系统的持续改进,团队能更快、更自信地响应。
实现缓解措施自动化
选择智能体的自主程度。从人工审核建议到全自动化响应,SRE 智能体可在安全范围内执行安全的缓解措施,减少人工操作、加快恢复速度,同时保障治理合规性和运营控制。
根据组织实践量身定制
通过自定义子智能体,让 SRE 智能体适配你的环境。集成工具、编码最佳做法、对接知识源并实现工作流自动化,让该智能体如同你自己的专家一样,在契合内部标准和流程的同时加快响应。
获取智能见解
从被动的应急处理,转向可靠性预防工程建设。SRE 智能体可提前检测新兴风险、配置错误和趋势,对重要事项进行优先级排序,并提供可操作的修复方案,以此预防服务中断、提升弹性、降低故障成本。
与 GitHub Copilot 协作
将操作见解转化为持久的代码修复方案。SRE 智能体可在 GitHub 中创建带场景信息的问题,Copilot 会提出针对性修补方案,帮助团队消除根本原因、减少重复事件,通过闭环的 DevOps 工作流加快交付速度。
连接到外部 MCP 服务器
借助可扩展的智能体平台,统一你的 SRE 生态系统。Azure SRE 智能体通过模型上下文协议 (MCP) 连接可观测性、DevOps、事件和知识工具,作为智能层整合现有系统、避免锁定,且能随你的操作进行扩展。
扩展各种运营工作流
将 Azure SRE 智能体打造为你环境中的运营大脑。通过自定义 MCP 服务器扩展工作流,统一混合云和多云系统的信号,实现诊断和缓解措施自动化,无需重构工具和流程即可大幅提升可靠性。
安全
嵌入的安全性和合规性
34,000
Microsoft 专职从事安全项目的全职等效工程师数量。
15,000
具备专业安全专长的合作伙伴。
>100
合规认证,包括超过 50 项针对全球区域和国家/地区的认证。
定价
可缩放的基于使用量的计费
Azure 智能体单位 (AAU) 衡量 Azure 托管的自主智能体(如 SRE 智能体)的工作。AAU 采用即用即付的方式计费。SRE 智能体的收费包括两个组成部分:用于持续监控的固定、始终在线流和用于事件缓解及其他 AI 积极参与任务的基于使用量的活动流。总费用是固定基线费用和基于使用量的增量费用的组合。
相关产品
Azure 产品协同工作效果更佳
增强 Azure 上应用程序的可靠性、可伸缩性和效率。
客户案例
了解客户如何使用 Azure SRE 智能体进行创新
资源
开始使用 Azure SRE 智能体
常见问题解答
常见问题解答
常见问题解答
- Azure SRE 智能体是一项 AI 支持的服务,帮助运营团队监控、诊断和解决 Azure 托管应用中的问题,以提高可靠性、性能和运营效率。
- Azure SRE 智能体是一款全天候运行的 AI 可靠性服务,可连接你的 Azure 资源、遥测数据、运行手册和事件工具。它持续监视运行状况,结合日志、指标和依赖关系上下文调查警报,并执行可解释的根因分析。该智能体可在策略管控和人工审批的前提下,推荐或执行重启、缩放或回滚等缓解措施。
- Azure SRE 智能体帮助组织缩短平均修复时间 (MTTR)、减少运营繁琐工作,同时规模化提升可靠性和一致性。它可实现事件响应的标准化,强化最佳做法和运行手册,并通过主动检测和安全自动化,提升服务级别协议 (SLA) 的达标率。它通过内置和自定义 MCP 服务器,将其功能与 Azure Monitor、ServiceNow、PagerDuty、GitHub 等外部服务进行扩展,从而强化治理、可审计性和 DevOps 反馈循环。
- 探索产品文档以了解更多关于 SRE 智能体的信息。
- 每个智能体的基础费用为每小时 4 个 Azure 智能体单位。智能体执行的每个任务按使用量额外收费,每秒 0.25 个 Azure 智能体单位。总费用是固定基础费用和基于使用量的增量费用的组合。请参阅定价页面以获取你所在地区 Azure 智能体单位的单价。
- Azure 智能体单位 (AAU) 是一个标准化的消费单位,代表 Azure 托管的自主智能体(包括 Azure SRE 智能体)所执行的智能工作。