适用于容器的 Azure Monitor 现在支持建议的警报
发布日期:七月 20, 2020
适用于容器的 Azure Monitor 现在包含建议的警报。使用此功能可在 Azure Kubernetes 服务 (AKS) 群集中一键式启用警报。使用这些预配置的指标警报,可以监视系统资源的运行高峰容量或故障率。此功能目前为预览版。
AKS 群集当前支持这些警报:
平均容器 CPU 使用率 |
计算每个容器使用的平均 CPU。 |
如果每个容器的平均 CPU 使用率大于 95%。 |
容器工作集内存平均利用率 |
计算每个容器使用的工作集平均内存。 |
如果每个容器的工作集平均内存使用率大于 95%。 |
平均 CPU 使用率 |
计算每个节点使用的平均 CPU。 |
如果节点平均 CPU 利用率大于 80%。 |
磁盘平均使用率 |
计算节点的磁盘平均使用率。 |
如果节点的磁盘使用率大于 80%。 |
工作集内存平均使用率 |
计算节点的工作集平均内存使用率。 |
如果节点的工作集平均内存使用率大于 80%。 |
正在重启的容器计数 |
计算正在重启的容器数。 |
如果容器重启大于 0。 |
失败的 pod 计数 |
计算是否有任何处于失败状态的 pod。 |
如果处于失败状态的 pod 数大于 0。 |
节点 NotReady 状态 |
计算是否有任何节点处于 NotReady 状态。 |
如果处于 NotReady 状态的多个节点大于 0。 |
因 OOM 终止的容器数 |
因 OOM 终止的容器数。 |
如果多个因 OOM 终止容器大于 0。 |
已就绪 pod 百分比 |
计算 pod 的平均就绪状态。 |
如果 pod 的就绪状态小于 80%。 |
已完成的作业计数 |
计算超过 6 小时之前完成的作业数。 |
如果超过 6 小时的过期作业数大于 0。 |
可以通过 Azure 门户和 ARM 模板启用这些警报。