Надежность Azure
Получите доступ к инструментам и учебным ресурсам, необходимым для уверенного проектирования и эксплуатации критически важных систем
Надежность — это общая ответственность
Достигайте целевых показателей надежности вашей организации для всех рабочих нагрузок, обеспечив устойчивую основу — облачную платформу Azure. Разработайте и применяйте критически важные приложения с уверенностью в том, что облачным ресурсам можно доверять, ведь прозрачность является приоритетом Azure. Вы всегда будете получать актуальную информацию и сможете быстро реагировать при возникновении проблем со службами.
Если вы хотите оптимизировать существующее приложение в Azure, начните с Azure Well-Architected Framework — набора руководящих принципов в пяти основных сферах: надежность, безопасность, эффективность работы, оптимизация затрат и процессов.
Создайте надежную основу на инфраструктуре Azure
Узнайте о текущих инвестициях корпорации Майкрософт, направленных на поддержку и улучшение надежности облачных платформ в блог-серии CTO и технического специалиста Azure Марка Руссиновича (Mark Russinovich), посвященной повышению надежности, в частности о таких четырех последних темах: надежность сети благодаря интеллектуальному программному обеспечению, безопасная разработка с использованием ИИ для ИТ-операций (обзор службы Gandalf), моделирование угроз устойчивости для крупных распределенных систем, а также обслуживание с низким уровнем воздействия или без него.
Сеть Майкрософт объединяет более 60 регионов Azure, 200 центров обработки данных Azure, 190 граничных объектов и более 175 000 миль оптоволоконного кабеля на земле и под водой, подключаясь к глобальной сети Интернет в стратегических граничных точках присутствия по всему миру. Узнайте больше о надежности сети Майкрософт из этой записи блога, состоящей из двух частей.
Непрерывный мониторинг метрик работоспособности является важной частью процесса развертывания, и именно здесь ИИ для ИТ-операций (AIOps) играет важную роль. Узнайте в этой записи блога, как ИИ и машинное обучение используются для расширения возможностей инженеров DevOps, мониторинга процесса развертывания Azure в большом масштабе, обнаружения проблем на раннем этапе и принятия решений о развертывании и откате на основе области влияния и серьезности.
Узнайте, как группы инженеров служб Azure используют "итоговый анализ" в качестве меры для лучшего понимания того, что и как пошло не так и каким образом это повлияло на клиента, а также как они получают ценные сведения в процессах итогового анализа и моделирования угроз устойчивости.
Узнайте о технологиях обновления с низким уровнем воздействия или без него, в том числе о горячем исправлении кода, обслуживании с сохранением состояния памяти и динамической миграции, которые используются в Azure для поддержания работы инфраструктуры с минимальными влиянием на клиентов и длительностью простоев или вовсе без них.
Выберите возможности обеспечения устойчивости в Azure согласно своим потребностям
Узнайте, какие возможности высокого уровня доступности, аварийного восстановления и резервного копирования Azure можно использовать с вашими приложениями. Научитесь выбирать оптимальные варианты вычислительных ресурсов, хранилища и географической (локальная, зональная и региональная) избыточности.
Обеспечьте устойчивость по умолчанию
Воспользуйтесь преимуществами дополнительных служб и функций Azure для достижения конкретных целей по обеспечению надежности.
Зоны доступности
Выполняйте критически важные рабочие нагрузки в центрах обработки данных с независимым питанием, охлаждением и сетевой инфраструктурой.
Группы доступности
Обеспечьте избыточность в центре обработки данных с помощью совместного размещения ресурсов или их разделения.
Диспетчер трафика Azure
Реализуйте автоматическую отработку отказа, оптимизируйте трафик и объедините локальные и облачные системы.
Azure Site Recovery
Выполняйте репликацию рабочих нагрузок в локальной среде и в Azure с основного сайта в дополнительное расположение.
Azure Backup
Выполняйте резервное копирование данных с помощью простого, безопасного и экономичного решения для восстановления.
Служба хранилища Azure
Создавайте и храните несколько копий своих данных с вариантами избыточности для любых сценариев.
Выполняйте мониторинг облака, чтобы избежать неожиданностей
Обеспечьте долгосрочную надежность с помощью средств мониторинга для идентификации, диагностики и отслеживания аномалий, а также оптимизируйте безопасность эксплуатации и производительность.
Azure Chaos Studio
Систематически улучшайте устойчивость с помощью контролируемого хаоса.
Работоспособность служб Azure
Выявляйте проблемы с ресурсами и устраняйте их с помощью настраиваемой панели мониторинга.
Azure Monitor
Собирайте данные телеметрии из Azure и локальных сред, анализируйте их и принимайте необходимые меры.
Azure Application Insights
Получайте интеллектуальные аналитические сведения об использовании приложений и выполняйте диагностику аномалий.
Наблюдатель за сетями
Обеспечьте мониторинг, диагностику и анализ производительности и работоспособности сети.
Помощник по Azure
Оптимизируйте приложения и системы для повышенной надежности с помощью рекомендаций на основе телеметрии использования.
Документация, учебные материалы и другие ресурсы
Центр архитектуры Azure
Создавайте надежные решения с помощью готовых шаблонов и рекомендаций:
Microsoft Learn
Изучите новые навыки, которые помогут вам сделать приложения и системы более надежными, с помощью следующих модулей Microsoft Learn:
Обеспечение надежности информационных систем (SRE)
Узнайте, как применять SRE — дисциплину, которая помогает организациям добиться нужного уровня надежности для систем, услуг и продуктов: