Trace Id is missing
Пропустить и перейти к основному содержимому

Что такое аварийное восстановление?

Аварийное восстановление — это совокупность методов, практик и технологий,  используемых организациями для восстановления данных и доступа к ИТ-системе после технических сбоев.

Теперь, рассмотрев определение аварийного восстановления, давайте разберемся, что именно подразумевает под собой "сбой". Технические сбои включают в себя такие события, как сбои в работе служб, перебои в работе сети, отказы серверов и нарушения системы безопасности. Эти события вызываются различными силами, такими как:

  • Стихийные бедствия, такие как ураганы и землетрясения.
  • Технологические сбои и перебои в подаче электроэнергии.
  • Кибератаки, такие как программы-шантажисты.
  • Ошибка пользователя.
  • Пандемии и эпидемии.

Такие сбои могут нанести многомиллионный вред крупным предприятиям, а некоторые малые предприятия так и не могут оправиться от них. Надежный план аварийного восстановления может спасти вашу организацию от многомиллионных убытков.

Как выглядит план аварийного восстановления?

План аварийного восстановления должен быть нацелен на поддержание непрерывности бизнес-процессов. Непрерывность бизнес-процессов — это поддержание и восстановление нормальной работы предприятия во время и сразу после технического сбоя. Надежная стратегия аварийного восстановления способствует непрерывности бизнес-процессов за счет оптимизации системы безопасности, обнаружения угроз и сбоев, избыточности данных и времени их восстановления.

В последние годы планы аварийного восстановления, основанные на облачных вычислениях, становятся все более популярными во многом благодаря тому, что они удешевляют поддержание непрерывности бизнес-процессов. Без облачного резервного копирования данных и инфраструктуры приходится полагаться на локальные варианты резервного копирования. Для этого необходимо иметь второй центр обработки данных, расположенный достаточно далеко, чтобы на него не влияли те же обстоятельства (например, перебои в подаче электроэнергии), что и на ваш основной центр обработки данных. Очевидно, что строительство и обслуживание второго центра обработки данных может быть дорогостоящим мероприятием, стоимость которого может вырасти в зависимости от типа резервного копирования, необходимого вашей организации. 

Аварийное восстановление в действии

Допустим, стихийное бедствие, например наводнение, разрушает основной центр обработки данных организации. Если у организации есть стратегия аварийного восстановления, вероятность восстановления важных данных значительно выше. Существует несколько различных методов резервного копирования, которые организация могла бы использовать заранее, чтобы быстро восстановиться после такого сценария:

  • Репликация критически важных данных во вторичном центре обработки данных в другом физическом месте. Репликация — это постоянное копирование данных в другой центр обработки данных. Часто вторичный центр обработки данных принадлежит поставщику облачных служб.  
  • Съемный диск, хранящийся в основном центре обработки данных. Если извлечь диск до того, как произойдет сбой, его можно использовать для восстановления данных в другом центре обработки данных.
  • Удаленный центр обработки данных, хранящий данные во вторичном центре обработки данных. Вторичный центр обработки данных должен находиться достаточно далеко от основного центра обработки данных, чтобы его не затронула тот же сбой. Использование этого метода требует регулярного резервного копирования данных в удаленный центр.  
  • Служба облачного резервного копирования, например Azure Backup, автоматически создающая резервные копии данных в облаке. Зачастую этот метод оказывается более экономичным, чем локальные варианты.

Эти методы резервного копирования также эффективны, если данные вашей организации пострадали в результате нарушения системы безопасности. Допустим, атака с использованием программы-шантажиста. Во время атаки с использованием программы-шантажиста киберпреступник устанавливает вредоносную программу, которая блокирует конфиденциальные данные и/или важные для бизнеса системы и требует выкуп за предоставление доступа. Если ваша организация создала безопасную резервную копию критически важных данных с помощью одного из описанных выше методов, потенциальное воздействие программ-шантажистов и других кибератак может быть значительно снижено.  

Создание плана аварийного восстановления

Планирование аварийного восстановления начинается с формирования команды аварийного восстановления для определения критически важных систем и данных. Команда должна разработать план аварийного восстановления, обеспечивающий максимальную защиту данных для предотвращения их потери, а также корректирующие меры, гарантирующие скорейшее восстановление доступа к важным данным в случае его утраты.

В плане аварийного восстановления необходимо уделять приоритетное внимание двум ключевым показателям: целевое время восстановления (RTO) и целевая точка восстановления (RPO):

  • RTO определяет количество времени, которое требуется вашей организации для восстановления доступа, данных и функциональных возможностей после технического сбоя.
  • RPO, с другой стороны, означает количество времени, которое может потребоваться вашей организации для восстановления основных функций и доступа к данным до того, как будут понесены значительные потери. RPO определяет, как часто следует создавать резервные копии важных данных. Например, если RPO вашей организации составляет четыре часа, резервное копирование критически важных данных должно выполняться не реже одного раза в 4 часа.

Наметив план аварийного восстановления для достижения RPO, вам нужно будет его доработать. Вот некоторые рекомендации по аварийному восстановлению:

  1. При составлении и изменении планов аварийного восстановления учитывайте нормативно-правовые аспекты. Во многих регионах законы о конфиденциальности данных требуют наличия планов аварийного восстановления для защиты конфиденциальных данных. Это законодательство должно стать неотъемлемой частью стратегии аварийного восстановления вашей организации. Неспособность быстро восстановить скомпрометированные данные после сбоя может привести к нарушению нормативных требований и штрафам.
  2. Регулярно тестируйте свой план аварийного восстановления и выявляйте новые угрозы. Недостаточно иметь план аварийного восстановления: регулярно тестируйте его и корректируйте по мере появления новых угроз. Это гарантирует, что вы не будете застигнуты врасплох масштабом или необычностью технического сбоя.
  3. Обучите сотрудников процедурам аварийного восстановления. Сотрудники, заранее подготовленные к сбою, с гораздо большей вероятностью успешно справятся со своими обязанностями во время аварийного восстановления.

Как уже говорилось в предыдущем разделе, существует несколько различных методов достижения избыточности данных. Ваша команда аварийного восстановления должна определить, какой из них будет наиболее эффективным способом резервного копирования важных данных с учетом RPO. Есть также несколько облачных решений, которые могут помочь. Вот некоторые из них, которые следует учитывать при составлении плана аварийного восстановления:

  • Решения для резервного копирования и аварийного восстановления создают резервные копии данных, храня их в облаке. Поставщики облачных услуг, такие как Azure, предлагают сквозное резервное копирование, масштабируемое и безопасное.  
  • Виртуализация — это услуга резервного копирования данных и целых вычислительных сред с помощью виртуальных машин. Это позволяет сотрудникам быстро получить доступ к своим файлам и рабочим средам в случае выхода из строя основного центра обработки данных.
  • Решения VMware для резервного копирования помогают создавать резервные копии виртуальных машин Vmware в облаке. Резервное копирование виртуальных машин Vmware в Azure можно выполнять с помощью серверов резервного копирования Microsoft Azure.

Это лишь некоторые из множества доступных облачных решений для аварийного восстановления. При составлении плана аварийного восстановления следует выбирать методы и решения, которые защищают наиболее важные типы данных в вашей организации. При этом, независимо от ваших потребностей в резервном копировании и восстановлении, аварийное восстановление в облаке обычно более экономично, чем использование второго локального центра обработки данных. 

Как Azure может помочь с облачным аварийным восстановлением

Azure предлагает несколько услуг и решений для аварийного восстановления:

  • Резервное копирование и аварийное восстановление  — это комплексное решение: простое, безопасное и экономически эффективное. Решения Azure для аварийного и резервного восстановления могут быть интегрированы с локальной системой защиты данных.
  • Azure Backup помогает защититься от программ-шантажистов и других угроз. Это экономически эффективное решение по сравнению с локальными вариантами резервного копирования и его можно масштабировать в зависимости от ваших потребностей.
  • Azure Site Recovery это собственная служба аварийного восстановления, встроенная в Azure. Azure Site Recovery работает путем репликации ваших виртуальных машин Azure в центр обработки данных в другом регионе.
  • JetStream DR — это решение для аварийного восстановления в облаке, предназначенное для минимизации времени простоя рабочих нагрузок VMware’и виртуальных машин в случае аварии. 

Часто задаваемые вопросы

  • Основная цель аварийного восстановления заключается в восстановлении бизнес-операций и ИТ-системы после технического сбоя. 

  • Резервное копирование — это создание копий данных, а аварийное восстановление — это более широкий набор процедур и технологий, позволяющих восстановить ИТ-системы, приложения и данные в случае сбоя.

  • Обучение аварийному восстановлению включает в себя обучение сотрудников процедурам, связанным с восстановлением ИТ-систем, доступа и данных при возникновении технического сбоя. Кроме того, на сайте Microsoft Learn можно найти учебные модули по аварийному восстановлению.