Катастрофо­устойчивое облако для сайта и DR для внутренних систем

Как мы подобрали комплексный набор инструментов послеаварийного восстановления для крупного ритейлера.

Катастрофо­устойчивое облако для сайта и DR для внутренних систем

Задача

Компания-ритейлер размещает на своем сайте каталог товаров для дома и офиса. Частным и корпоративным клиентам доступен личный кабинет сайта, где можно оформить заказ, подключиться к программе лояльности и воспользоваться бонусами. 

База данных сайта размещена в облаке DataLine. Бэкапы этой базы изначально хранились на собственной площадке ритейлера. Там же размещались остальные ИТ-приложения: системы внутреннего учета, файловые хранилища и т. д. 

Заказчик хотел обеспечить максимальную отказоустойчивость всей инфраструктуры, но опасался высокой стоимости решений для послеаварийного восстановления (DR). Специалисты DataLine предложили разработать выгодную схему инфраструктуры c учетом разных DR-сценариев.

Что нужно было сделать
  • Обеспечить максимальную защиту для базы данных. Наиболее критичным процессом для бизнеса была работа интернет-магазина. Нужно было обеспечить высокую доступность инфраструктуры, на которой размещена база данных сайта. Даже в случае сбоя работа интернет-магазина должна была восстановиться за пару минут.

  • Подобрать оптимальное DR-решение для остальных ИТ-сервисов. Восстановление внутренних систем не требует скорости в несколько минут, но их тоже важно защищать от аварий. Заказчик планировал оставить эти системы на своей площадке и искал выгодное DR-решение на случай ее недоступности.

  • Организовать надежное хранение данных. Также заказчик думал о защите на случай человеческих ошибок, вирусов-шифровальщиков и прочих рисков потери данных. Чтобы обезопасить базы данных от случайного удаления информации, были необходимы резервные копии всех ключевых систем.

Как решили задачу
Выбрали решение для базы данных

Для восстановления сайта заказчику сначала предложили DR-решение vCloud Director Availability (vCDA). Этот инструмент позволяет создать реплики ВМ и разместить их на резервной площадке в облаке DataLine. В случае недоступности основной площадки сервис в облаке можно запустить за 15 минут. Такая скорость восстановления смущала ритейлера: за это время он мог потерять довольно много потенциальных покупателей.

Тогда заказчику предложили вариант катастрофоустойчивого облака на базе двух дата-центров, NORD и OST. Связь между ними настроена через резервированные каналы связи. В таком облаке данные виртуальных машин одновременно записываются на СХД в каждом дата-центре, Это позволяет обеспечить доступность приложения на уровне 99,99% и исключить потерю данных при аварии (нулевое RPO) даже при полном отказе одной из площадок. 

Для одной базы данных стоимость катастрофоустойчивого облака оказалась ненамного выше цены vCDA. При этом в случае полного отказа одной площадки базу данных можно было поднять за 2 минуты.

Предложили защиту для остальных ИТ-приложений

Возможности vCDA хорошо подошли для восстановления внутренних систем. С этим решением можно организовать послеаварийное восстановление в облако провайдера со своей площадки.

Системные администраторы ритейлера могут сами управлять настройками репликации и восстановлением ВМ. В консоли vCDA они указывают нужную частоту сеансов репликации и количество точек восстановления. Переключиться на резервную площадку можно самостоятельно через консоль решения.

Сервис предоставляется по модели Pay as you go: пока реплики в облаке выключены, заказчик платит 10% от стоимости ресурсов виртуальной машины. Такой вариант дает необходимый уровень защиты внутренних систем при более выгодной стоимости.

Взяли на себя управление резервным копированием

Для защиты данных заказчик выбрал управляемый бэкап через Veeam Backup & Replication, который администрируют инженеры DataLine. Резервные копии разместили отдельно от реплик, в другом дата-центре. Специалисты DataLine полностью отвечают за настройку бэкапов и управление политиками резервного копирования.  

Протестировали DR-решения перед запуском

Инженеры DataLine перенесли базу данных в катастрофоустойчивое облако и убедились, что скорость восстановления соответствует заявленным 2 минутам. Работу vCDA заказчик смог настроить и протестировать самостоятельно за счет встроенной функции тестового восстановления.

Что получил клиент
Защиту от всех значимых рисков

Катастрофоустойчивое облако обеспечивает максимальную доступность интернет-магазина, реплики страхуют внутренние системы от падений, а бэкапы обеспечивают безопасность данных. При таком формате потери данных стремятся к нулю.

Оптимизацию расходов

Заказчик использует дорогостоящие инструменты для самых важных для бизнеса данных и экономит на защите менее критичных ИТ-систем.

Гарантию от надежного провайдера

Заказчику больше не нужно тратить время сотрудников на поддержание высокой доступности сайта и его грамотное резервное копирование. Теперь это ответственность сотрудников DataLine, которые специализируются на DR-решениях.  

В соглашении с DataLine прописана требуемая скорость восстановления систем и скорость реакции техподдержки на инциденты. За соблюдение этих параметров предусмотрена финансовая ответственность.

Запрос консультации по услуге "Катастрофоустойчивое облако"

Есть похожая задача? Хотите попробовать услугу "Катастрофоустойчивое облако"?

Оставьте заявку — мы свяжемся и обсудим, чем можем вам помочь

CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.
Катастрофоустойчивое облако
  • Географически разнесенный кластер виртуализации: все элементы кластера продублированы на площадках OST – на востоке и NORD – на севере Москвы.
  • Полное резервирование всех элементов кластера: серверов, СХД, сетевого оборудования и оптоволоконных трасс между площадками OST и NORD.
  • Синхронная репликация и сохранность данных при переключении на резервную площадку.
  • При полном выходе из строя одной площадки старт виртуальной машины на второй площадке – от 2 минут.

Другие кейсы

Как мы помогли клиенту добиться высокой доступности систем и минимальной потери данных с помощью сервиса DRaaS и резервного копирования.

Аварийное восстановление (DR)

Как мы помогли сократить недоступность официального сайта банка с 2,5 часов до 2,5 минут.

Аварийное восстановление (DR)

Организация удаленной работы для внештатных разработчиков с защитой корпоративных данных от копирования.

Виртуальные рабочие места