在移动到云的同时,IT 操作团队重新设计了基础结构监视模型

看看采用分散的监视方法如何使 IT 和商业应用程序团队为他们的角色带来更多的价值。

挑战:适应云操作模型

以前当 Microsoft Core Services and Engineering (CSEO) 的可管理性平台团队在集中的监视和警报环境中管理基础结构时,模型非常清楚:他们提供了商业应用程序团队使用的自包含服务。然后,Microsoft 移动到了云,此模型不再有用。

随着公司将内部系统和应用移动到 Azure,商业应用程序团队创建了自己的虚拟机 (VM) 并且希望完全控制它们,但可管理性平台团队仍负责监视和管理它们。尝试划分责任并不能解决问题。可管理性平台团队意识到,在移动到云之后,实现其支持开发团队这一任务的最佳方式是摆脱日常监视业务,努力打造一种新的、分散的监视模型。

"The move to Azure redefined the relationship between business app teams and us … It literally broke how we worked, including our accountability model, and we had to redesign our support services to accommodate the new self-service cloud model."

Dana Baxter,可管理性平台的主要服务工程师

改变控制文化

最初,可管理性平台团队尝试创建自己的 Azure 订阅池,以供商业应用程序团队使用。他们很快发现,对于那些想要自己管理事务的团队来说,这仍是一个瓶颈。随着自动化和自助服务功能在 Azure Monitor 中的推出,可管理性平台团队看到了一个取代其集中模型,并将监视责任移交给商业应用程序团队的机会。同时,他们也明白,必须推动具有挑战性的文化转变以克服阻力。

但首先,他们必须确保新 DevOps 模型的操作部分是合适的。他们将一些旧警报从大约 100 个清理到了 15 个,然后在 GitHub 上创建了一个工具包,以帮助商业应用程序团队监视自己的基础结构。工具包起到了缓冲带的作用,帮助可管理性平台缓解由于他们不得不放弃对拥有多年的事务的控制而导致的不适感。他们的最后一步是在整个组织内进行大量的、多方面的沟通和培训工作。

"Our KPIs used to be all about alerts, trouble tickets, time to resolution, and so on. Today they're around things like inventory, security patching, compliance, and other components of enterprise manageability."

Dana Baxter,可管理性平台的主要服务工程师

分散的监视可提高这两个团队的工作效率

向分散的自助式企业监视和报告方法转变并不容易,但却值得努力。现在,借助 Azure Monitor 和 Power BI 支持的报表和仪表板工具,商业应用程序团队能够轻松监视其环境的任何部分。在能够快速定制自己的仪表板和警报,以便与构建和管理应用的方式保持一致后,他们能够配置可最佳满足他们的需求的监视环境。现在,可管理性平台团队成员已成为开发合作关系中的重要顾问,而不是提供开发团队使用的日常监视服务。最重要的是,他们可以自由地专注于更具战略性和前瞻性的项目(例如安全修补、库存和符合性),从而带来更多商业价值。

仔细看看团队为实现云操作模型所经过的历程。

阅读完整案例