Как составить эффективный план аварийного восстановления данных, 6 простых шагов
Практически любой бизнес можно свести к двум жизненно важным составляющим: компетентности сотрудников и данным, циркулирующим в его внутренних системах. Для последнего - безопасность превыше всего. Ведь залог успеха любого бизнеса в сборе и качественном анализе данных, которые затем служат базой для принятия правильных решений. Все это может стать бессмысленным, если не позаботиться об уровнях защиты конфиденциальной и важной информации компании.
Как сообщает Национальное управление архивов и документации, 9-ти из 10-ти компаний, пострадавших от стихийных бедствий, требуется около 10 дней, чтобы восстановить целостной своих данных. Это одна из причин, почему они разоряются в течение следующих 12 месяцев. Согласитесь, что это убедительный аргумент, чтобы позаботиться о защите данных, а именно разработать эффективный и безопасный план их аварийного восстановления.
Что такое план аварийного восстановления?
План аварийного восстановления (англ. - Disaster Recovery Plan, DRP) - это относительно простое понятие: процесс создания еще одной копии ваших данных. Для того, чтоб сделать ее правильно, требуется подробное исследование и тщательная проработка именно вашей основной стратегии безопасности данных.
DRP - это сегмент более широкой стратегии под названием Business Continuity Planning, которая включает в себя создание систем предотвращения сбоев и восстановления данных для борьбы с потенциальными угрозами для компании. Помимо предотвращения, цель состоит в том, чтобы обеспечить выполнение текущих операций до и во время аварии и в период восстановления работоспособности всей системы.
Наличие эффективного плана аварийного восстановления создает безопасную рабочую среду, поскольку вашим руководителям и сотрудникам не нужно беспокоиться об аварийных ситуациях, происходящих в ваших системах. Это обеспечивает оптимизированный, непрерывный рабочий процесс без значительных угроз простоя, поскольку вы можете легко и быстро возобновить свои проекты и бизнес-процессы в случае потери данных или сбоев системы.
Зачем вам нужен план аварийного восстановления
Представим себе следующий сценарий: ваши системы были заражены вредоносным объектом, который повреждает вашу инфраструктуру и создает среду, в которой ваши критические файлы внезапно становятся совершенно непригодными для использования. Если у вас нет четкой стратегии действий в такой ситуации, вы, как правило, мало что можете сделать, чтобы возобновить свою деятельность прямо сейчас. Не говоря уже о восстановлении систем и данных до той же функциональной архитектуры, которая была у вас до катастрофы.
Некоторые типы вредоносных программ специально предназначены для полного стирания основной загрузочной записи, что приводит к повреждению системы, которое невозможно исправить. Также существуют типы повреждений физической инфраструктуры, вызванные стихийными бедствиями. Оба типа этих повреждений способны разрушить бизнес без возможности восстановления.
Имея это в виду, давайте составим эффективный план аварийного восстановления за 6 шагов:
Шаг 1: Анализ рисков
Определение критически важных приложений, серверов и активов, а также их ценности для вашего бизнеса - это первый этап создания стратегии. Выясните, что необходимо защитить и как эту защиту следует развернуть. Проанализируйте, каким потенциальным угрозам подвержены эти активы. Далее, установите протоколы действий для каждого типа потенциальной угрозы.
Если ваша компания ориентирована на клиентов, рекомендуется определить, какая часть клиентов может быть напрямую затронута, в ситуации если какая-то часть вашей системы выйдет из строя. Также необходимо оценить потенциальные финансовые последствия. Например, определите, сколько ресурсов ваша компания может потерять за каждую минуту, когда ваши серверы, приложения или другие ресурсы не работают.
Шаг 2: Определите максимально допустимое время простоя
Обязательно определите самый длительный период, в течение которого ваши системы могут быть отключены, не нанося необратимого ущерба вашему бизнесу, активам, данным, приложениям, операциям и т. д. Каждая компания должна определить максимально допустимое время простоя, поскольку оно зависит от множества факторов, а средняя норма не всегда одна и та же.
Шаг 3. Определите целевое время восстановления
Целевое время восстановления учитывает минимальное время, необходимое для возобновления работы жизненно важных бизнес-операций, систем и приложений. Это должно напрямую коррелировать с периодом максимально допустимого времени простоя, а также зависеть от различных внутренних факторов.
Шаг 4. Определите цель точки восстановления
У каждого предприятия должна быть Цель Точки Восстановления (англ. - Recovery Point Objective, RPO) для плана аварийного восстановления. RPO определяет, сколько данных ваша организация способна потерять без полного отказа.
Допустим, ваши системы создают резервные копии каждый день в 22:00, но аварийное событие происходит на следующий день в 20:00. Это означает, что все данные, сохраненные и обработанные в течение интервала между ними (который в данном случае составляет 22 часа), будут потеряны, поскольку ваша точка восстановления взята из резервной копии предыдущего дня. Для большинства организаций (в основном в FinTech, например) этот тип точки восстановления неприемлем, и их RPO следует устанавливать на самую последнюю секунду.
Шаг 5: Репликация данных
В зависимости от размера вашего бизнеса и объема обрабатываемых данных, вам необходимо сначала выяснить, нужен ли вам еще один сайт аварийного восстановления. Если окажется, что Zfortон вам нужен, можно выбрать один из двух основных вариантов с точки зрения архитектуры:
- облако;
- физический. Изучите оба варианта и выясните, какое оптимальное решение подходит для модели и размера вашего бизнеса. У каждого есть свои плюсы и минусы.
Физическое аварийное восстановление дает вам больший контроль над вашими данными и устраняет необходимость участия третьих сторон, но включает в себя больше задач, связанных с обслуживанием, и не так рентабельно с точки зрения инвестиций в инфраструктуру.
С другой стороны, облачная архитектура обеспечивает более высокую доступность, лучшую масштабируемость и больше возможностей для снижения затрат благодаря масштабируемой модели ценообразования с оплатой по мере использования. Обратной стороной является больший потенциал для проблем с безопасностью и угроз.
Еще одно полезное правило - развернуть архивирование электронной почты, чтобы убедиться, что ваши электронные письма и конфиденциальные данные, которые они содержат, защищены и доступны. Это может пригодиться, когда стихийное бедствие поражает ваши системы и данные. Также архивирование электронной почты является отличным решением для потенциальных юридических проблем, с которыми может столкнуться ваш бизнес.
Шаг 6. Тестирование
Чтобы ваша стратегия аварийного восстановления данных была эффективной и надежной, она должна включать тестирование на различных уровнях. Вот несколько задач, связанных с тестированием:
- проверка работоспособности вашего плана, насколько он и эффективен;
- анализ и сохранение результатов каждого вышеупомянутого шага;
- проверка времени, необходимого для всей симуляции от начала до момента, когда ваши системы снова заработают, и вы можете работать с восстановленными данными;
- регулярное обновление плана аварийного восстановления, особенно если ваш бизнес начинает расширяться;
- обновление и тестирование вашего плана при каждом значительном изменении или обновлении вашей инфраструктуры.
Заключение
У всех предприятий должен быть соответствующий план аварийного восстановления данных. Это позволяет быстро и правильно отреагировать, если ваша компания столкнется с бедствием, которое может повлечь непоправимое повреждение своих систем и критически важных данных. Эта стратегия поможет вам быстро прийти в норму и убедиться, что потери сведены к минимуму, а катастрофа предотвращена. Мы в Zfort Group постоянно работаем над вопросами безопасности данных и систем не только внутри нашей компании, но и при работе над проектами клиентов. Надеемся, что наш опыт поможет вам составить и внедрить свой собственный эффективный план аварийного восстановления данных, чтобы свести к минимуму риски, связанные с безопасностью.