跳到主内容

在移动到云的同时,IT 操作团队重新设计了基础结构监视模型

看看采用分散的监视方法如何使 IT 和商业应用程序团队为他们的角色带来更多的价值。

阅读完整案例

挑战:适应云操作模型

以前当 Microsoft Core Services and Engineering (CSEO) 的可管理性平台团队在集中的监视和警报环境中管理基础结构时,模型非常清楚:他们提供了商业应用程序团队使用的自包含服务。然后,Microsoft 移动到了云,此模型不再有用。

随着公司将内部系统和应用移动到 Azure,商业应用程序团队创建了自己的虚拟机 (VM) 并且希望完全控制它们,但可管理性平台团队仍负责监视和管理它们。尝试划分责任并不能解决问题。可管理性平台团队意识到,在移动到云之后,实现其支持开发团队这一任务的最佳方式是摆脱日常监视业务,努力打造一种新的、分散的监视模型。

"The move to Azure redefined the relationship between business app teams and us … It literally broke how we worked, including our accountability model, and we had to redesign our support services to accommodate the new self-service cloud model."

Dana Baxter,可管理性平台的主要服务工程师

改变控制文化

最初,可管理性平台团队尝试创建自己的 Azure 订阅池以供业务应用团队使用。他们很快发现,对于想要自己管理事务的团队来说,这仍然是一个瓶颈。随着自动化和自助服务功能在 Azure Monitor 中变得可用,可管理性平台团队有机会替换其集中模型并将监控责任交给业务应用团队。同时,他们知道必须推动一场具有挑战性的文化变革来克服阻力。

但首先,他们必须确保新 DevOps 模型的运营部分井然有序。他们清理了大量旧警报 - 从大约 100 个降至 15,然后在 GitHub 上创建工具包,以帮助业务应用团队监控自己的基础结构。该工具包建立了护栏,可帮助可管理性平台缓解因必须放弃数年来拥有的控制权而导致的不适。他们最后的努力涉及整个组织的重大、多方面的沟通和培训工作。

"Our KPIs used to be all about alerts, trouble tickets, time to resolution, and so on. Today they're around things like inventory, security patching, compliance, and other components of enterprise manageability."

Dana Baxter,可管理性平台的主要服务工程师

分散的监视可提高这两个团队的工作效率

向分散式、自助式的企业监控和报告方法过渡并不容易,但值得付出努力。现在,由 Azure Monitor 和 Power BI 启用的报告和仪表板工具使业务应用团队可以轻松监控其环境的任何部分。他们能够快速定制自己的仪表板和警报,以便与其构建和管理应用的方式保持一致,从而配置最能满足其需求的监控环境。如今,可管理性平台团队成员不再提供开发团队使用的日常监控服务,而是在与开发团队的合作中成为有价值的顾问。最重要的是,他们可以自由地专注于更具战略性、前瞻性的项目,例如安全修补、库存和合规性,从而为业务带来更多价值。

仔细看看团队为实现云操作模型所经过的历程。

阅读完整案例
可以给你提供什么帮助?