Как составить план аварийного восстановления

Опубликовано: 2022-08-23

Будь то техногенная катастрофа или стихийное бедствие, если вы не отреагируете быстро, ситуация усугубится. Дженнифер Бриджес, PMP, покажет вам, как составить план аварийного восстановления.

Вот скриншот доски для справки.

что делать, когда приходит беда

В обзоре – Как составить план аварийного восстановления

Катастрофы случаются, сказала Дженнифер, но восстановление должно быть запланировано. Как и любой план, план аварийного восстановления состоит из частей.

Аварийное восстановление

Дженнифер рассказала, что такое план аварийного восстановления и из чего он должен состоять:

  • Он включает в себя набор политик, инструментов и процедур.
  • Он позволяет восстанавливать и поддерживать критически важные технологии, инфраструктуру и системы.
  • Он вызывается после стихийного бедствия (например, урагана, торнадо, пожара, наводнения и т. д.) или антропогенного (например, ошибок, нарушений, саботажа и т. д.).
  • Основное внимание уделяется информационным и/или технологическим системам, поддерживающим критически важную непрерывность бизнеса.
  • Это включает в себя поддержание функционирования всех основных аспектов бизнеса, несмотря на значительные разрушительные события.
  • Это считается подмножеством непрерывности бизнеса.

Почему мы заботимся об аварийном восстановлении?

К этому моменту ответ на этот вопрос должен быть очевиден, но на случай, если возникнет путаница, Дженнифер перечислила множество причин, по которым план аварийного восстановления так важен:

  • ИТ-проекты, системы и данные приобретают все большее значение для компаний и стран.
  • До этого спрос на быстрое восстановление высок.
  • Согласно исследованию, проведенному в 2015 году, компании с крупной потерей данных часто не восстанавливаются полностью: некоторые никогда не открываются повторно (43%), а другие закрываются в течение двух лет (29%).
  • В статье, опубликованной в 2018 году, говорится, что время простоя всего в один час обходится небольшим компаниям в 8 000 долларов, компаниям среднего размера — в 74 000 долларов, а крупным компаниям — в 700 000 долларов.

Почему тебя это беспокоит? Потому что на высоком уровне план аварийного восстановления помогает регулярно выполнять резервное копирование систем данных, чтобы избежать потери, и тестировать, чтобы убедиться, что эти процедуры выполняются в соответствии с планом. Затем, когда происходит бедствие, а оно произойдет, разрабатывается план восстановления и восстановления того, что было утрачено.

Связанные: Стратегии и лучшие практики управления ИТ-рисками

Что следует учитывать в плане аварийного восстановления

При составлении плана учитывайте следующие моменты:

  • Имейте экстренные контакты для сотрудников и внешних контактов, в том числе разработайте сеть уведомлений для эффективной связи.
  • Попытайтесь выяснить, каковы будут масштабы восстановления.
  • Создайте группу аварийного восстановления и запишите обязанности каждого члена. Это будет включать в себя наличие руководителя группы и группы управления, ответственной за процесс, в которую входят группы, отвечающие за сеть, сервер, приложения, данные и резервное копирование, восстановление ИТ-функций, ИТ-систем и сетевого оборудования.

Лучшие практики для плана аварийного восстановления

Перед тем как подписать контракт, Дженнифер предложила следующие три предложения относительно того, как выглядит передовой опыт при разработке плана аварийного восстановления:

  1. Практикуйтесь в восстановлении, чтобы быть готовым к настоящей катастрофе.
  2. Регулярно проверяйте этот процесс.
  3. Всегда делайте резервную копию и подтверждайте.

Профессиональный совет: всегда полезно составить план на случай непредвиденных обстоятельств, в основном резервную копию вашей резервной копии на случай, если катастрофа не разыграется, как ожидалось. Он начинается с определения и расстановки приоритетов с учетом рисков и обеспечения того, чтобы план был распространен среди всех затрагиваемых сторон.

Двигайтесь дальше: Нужна помощь в понимании рисков и проблем? Узнайте все о процессе управления рисками.

Спасибо за просмотр!

Транскрипция

Сегодня мы поговорим о том, как составить план аварийного восстановления. Что ж, для тех из нас, кто занимается ИТ, информационными технологиями, эта тема с каждым днем ​​становится все более актуальной.

В каком бы регионе мира вы ни находились, вы можете увидеть примеры либо стихийных бедствий, либо техногенных катастроф. Итак, давайте взглянем на то, что на самом деле представляет собой аварийное восстановление.

Во-первых, он включает в себя набор политик, инструментов и процедур.

Это позволяет восстановить или продолжить работу критически важных технологий, инфраструктуры и систем.

Он вызывается после стихийного бедствия или техногенных катастроф. Некоторыми примерами стихийных бедствий являются ураганы, торнадо, пожары, наводнения, поэтому они периодически поражают разные районы мира.

Кроме того, вы увидите антропогенные катастрофы, которые могут быть человеческими ошибками, такие вещи, как, возможно, обновление программного или аппаратного обеспечения, и просто человеческая ошибка вызывает проблему.

Также могут быть нарушения, такие как нарушения безопасности или даже саботаж. Иногда, когда сотрудники увольняются или расстраиваются, если у них есть доступ к технологии, они могут ее саботировать.

Что ж, аварийное восстановление также фокусируется на информационных и/или технологических системах, поддерживающих критически важную непрерывность бизнеса, и включает в себя поддержание функционирования всех основных бизнес-аспектов, несмотря на значительные сбои.

И это считается подмножеством непрерывности бизнеса, но это немного отличается от непрерывности бизнеса.

Так почему нас это вообще волнует?

Во-первых, ИТ-системы в данных становятся все более важными для компаний и, я бы сказал, для стран.

Также растет спрос на быстрое восстановление. Любые простои могут привести к катастрофе.

Итак, исследования 2015 года показывают, что компании с крупной потерей данных 43% так и не смогли восстановиться и снова открыться, 29% закрылись в течение двух лет.

Также от 2018 года есть статья «Важность аварийного восстановления», в которой говорится, что простой в течение часа может стоить небольшой компании примерно 8000 долларов, средней компании — около 74 000 долларов, а крупной — до 700 000 долларов. Таким образом, вы можете видеть, что это может иметь довольно большое влияние.

Так о чем мы говорим на высоком уровне? Итак, мы говорим о резервном копировании данных и систем, мы говорим о том, что после периодического резервного копирования мы должны протестировать его, чтобы убедиться, что этот подход работает и все работает.

Затем, когда происходит событие, мы должны восстановиться, а затем мы должны перестроиться. Так что на высоком уровне.

Итак, что нам нужно учитывать?

Итак, во-первых, если произойдет событие, если произойдет бедствие, кто является контактным лицом на случай чрезвычайной ситуации? Кто принимает вызов? Кому первое уведомление? Кто есть другие внешние контакты? А потом сеть уведомлений. Поэтому, как только это произойдет, все важные игроки должны быть уведомлены, чтобы можно было принять меры.

Также понимание объема того, как выглядит восстановление, и групп аварийного восстановления, и обязанностей. Поэтому, когда он вызывается, каждый член команды должен точно знать, за что он отвечает, чтобы он мог действовать.

Кроме того, важно знать, кто является руководителем аварийного восстановления, потому что именно он руководит этой работой по восстановлению.

Нам также необходимо знать команду по ликвидации последствий стихийных бедствий. Они несут ответственность за поддержание подходов, процессов и всего этого в актуальном состоянии.

Нам также необходимо знать сетевую группу, серверную группу, группу приложений и группу восстановления данных и резервных копий. Так кто же члены команды? И опять же, каковы их обязанности?

Итак, когда мы говорим о данных и говорим о резервном копировании, мы также хотим знать, какова частота? В зависимости от некоторых данных, некоторые данные постоянно резервируются в режиме реального времени.

Таким образом, они собирают данные и создают их резервные копии в режиме реального времени. И тогда нам нужно знать периоды хранения. Как долго мы храним резервные копии? Затем нам нужно знать восстановление, функциональность ИТ. Какие уровни? Что такое слои?

И какой процесс для того, чтобы мы восстанавливали. Нам также необходима инвентаризация всех ИТ-систем, которые могут быть затронуты, а также сетевого оборудования. Так что это может быть очень дорого, и это может быть очень подробно. Так что это просто общий взгляд на все аспекты, которые нам необходимо рассмотреть.

Итак, вот лишь несколько лучших практик, которые следует запомнить.

Во-первых, практикуйте восстановление.

Во-вторых, регулярно проверяйте весь процесс, чтобы убедиться, что он актуален.

И номер три, создайте резервную копию, а затем убедитесь, что резервные копии работают правильно.

Поэтому, если вам нужен инструмент, который может помочь вам с планом аварийного восстановления, подпишитесь на наше программное обеспечение прямо сейчас на ProjectManager.