Навигация
Системное Администрирование Решения на открытых кодах Структура сети Компьютерные сети малых предприятий Сеть с централизованным управлением Управление с помощью групповых политик Организация почтового обслуживания Взаимодействие с глобальной сетью Безопасность Виртуализация Парядок настройки и определения неисправностей Средства управления системами Автоматизация установки программного обестичения Решение проблем с компьютером Разное
 
 
Избранное
Pathping. Traceroute на стероидах.
FreeNAS: создаём сетевое хранилище (NAS)
Iperf - утилита для тестирования пропускной способности сети.
Средство против «сетевой слепоты»
Преимущества и недостатки RAID 6
Дисковые массивы RAID
Надежнее, чем RAID 5
Унификация корпоративных коммуникаций
Exchange и SAN: не все так просто
Cisco против Meru
 
 
Виртуализация - VMware Site Recovery Manager

VMware Site Recovery Manager – продукт автоматизирующий процессы аварийного восстановления, создания и тестирования планов восстановления после катастроф. Site Recovery Manager разработан компанией VMware как логическое продолжение развития виртуальной ИТ-инфраструктуры на базе платформы VMware Virtual Infrastructure 3.

Site Recovery Manager помогает организациям решить проблемы традиционного аварийного восстановления в соответствии с задачами времени восстановления (RTO), допустимого уровня потери данных (RPO) и иными нормами. Использование Site Recovery Manager обеспечивает управление аварийным переключением производственных ЦОД на удаленные резервные центры данных. Это решение также позволяет управлять аварийным переключением между двумя загруженными центрами, выполняющими функцию резервных площадок друг для друга. Site Recovery Manager можно также использовать при запланированном аварийном переключении ЦОД (например, при миграции ЦОД), автоматизируя и упрощая процесс перехода на новый центр данных.

Автор: Александр Цыганцев. .

Структурная схема системы аварийного восстановления на базе VMware Site Recovery Manager

Катастрофоустойчивая система состоит из основного и резервного сайтов (ЦОДов). Оба cайта имеют типовую виртуальную ИТ-инфраструктуру VMware: виртуальные машины запущены на серверах ESX централизованно управляемых сервером VirtualCenter. Администрирование производится с АРМ'а администратора с установленным VI Client.
VMware Site Recovery Manager
В каждый сайт добавляется сервер Site Recovery Manager, управляющий процессами аварийного восстановления и реализующий функционал создания, тестирования и выполнения планов восстановления. Кроме того, сервер SRM интегрируется с серверами VirtualCenter основного и резервного сайта, что обеспечивает централизованное управление процессами аварийного восстановления, мониторинг их состояния, а также оповещение операторов в случае возникновения аварийных ситуаций.
Работа SRM основывается на репликации блоков данных уровня дисковых массивов. Репликация обеспечивается средствами ПО производителей систем хранения. Для интеграции с дисковыми массивами SRM использует программные адаптеры репликации (SRA, Storage Replication Adapter), которые поставляются производителями дисковых массивов. Используя адаптер репликации, SRM проверяет наличие репликации LUN, на которых хранятся файлы защищаемых виртуальных машин, а также инициирует выполнение различных команд дисковыми массивами, таких как создание снапшотов, переключение режимов работы и т.п.
Site Recovery Manager может быть запущен как на одном сервере с VirtualCenter так и на разных, но в любом случае он использует отдельную базу данных.
Пользовательский интерфейс для работы с функционалом SRM реализуется с помощью плагина к VI Client.

Настройка инфраструктуры восстановления

Site Recovery Manager обеспечивает простой процесс подключения основного сайта к резервному и к используемому ПО репликации хранилища, а также конфигурации основного сайта. Предварительная настройка в общем случае включает в себя следующие шаги:

  • Настройка репликации LUN средствами ПО репликации системы хранения.
  • Установка сетевого соединения между серверами VirtualCenter и серверами SRM основного и резервного сайтов.
  • Установка соединения SRM с адаптерами SRA на основном и резервном сайтах. Проверка репликации LUN между сайтами.
  • Сопоставление порт-групп виртуальных машин, ресурсных пулов, серверов ESX и датацентров основного и резервного сайтов.
  • Создание защищаемых групп (Protection Group) на основном сайте. Protection Group – основной объект, используемый при создании планов восстановления. По сути это группа виртуальных машин, файлы которых хранятся в одной группе хранилищ (Datastore Group). Datastore Groups – объекты автоматически генерируемые на основании взаимосвязей реплицируемых LUNов, VMFS-томов и виртуальных машин по определенным правилам. Для простоты можно считать что, если LUN содержит один VMFS-том и все виртуальные машины имеющие файлы на этом VMFS-томе не имеют файлов хранящихся на других томах, то все это является одной группой хранилищ и соответствует одной защищаемой группе.
    VMware Site Recovery Manager
  • Для Protection Group необходимо определить Datastore for Placeholder VMs – VMFS-том на резервном сайте, в котором будут храниться метаданные для виртуальных машин (.vmsd, .vmx и .vmxf - файлы). Эти файлы сразу же копируются на резервный сайт и позволяют зарегистрировать защищаемые виртуальные машины в местном VirtualCenter.
  • Для каждой виртуальной машины в созданных защищаемых группах можно задать особые параметры восстановления на резервном сайте, такие как:
    • Датацентр;
    • Ресурсный пул;
    • Сетевая порт-группа;
    • Хранилище метаданных;
    • Customization Specification - предопределенная конфигурация виртуальной машины, включающая IP-адрес, пароль администратора и т.п.
    • Приоритет восстановления виртуальных машин;
    • Сообщения для администратора выполняющего резервное восстановление, которые будут выведены до и после включения виртуальной машины;
    • Скрипты, которые будут выполнены до и после включения виртуальной машины.

Для работы с SRM необходимо иметь соответствующие права доступа, которые задаются довольно гибко для всего функционала.

Создание планов восстановления

Site Recovery Manager позволяет создавать планы восстановления для разных сценариев аварийного переключения и различных частей инфраструктуры. План восстановления создается на резервном сайте из последовательно выполняемых типовых шагов:

  • Остановка виртуальных машин на основном сайте в порядке соответствующем их приоритетам.
  • Остановка виртуальных машин на резервном сайте при необходимости освобождения дополнительных ресурсов для восстанавливаемых ВМ.
  • Последовательное восстановление групп виртуальных машин, ранжированных по приоритетам восстановления.
  • Выполнение заранее определяемых сценариев восстановления виртуальных машин: выполнение команд и скриптов до и после восстановления.

VMware Site Recovery Manager
Для каждой восстанавливаемой виртуальной машины можно задать приоритет на использование процессора и памяти с помощью механизмов ресурсных пулов и параметров приоритета ресурсов самих виртуальных машин.
При создании плана восстановления используются определенные на основном сайте защищаемые группы (Protection Group).
Информация о созданных планах может быть экспортирована в XML, .doc, XLW, HTML и CSV форматы.

Аварийное восстановление

В нормальном режиме функционирования основного и резервного сайтов серверы SRM с обеих сторон реализуют мониторинг состояния резервируемого сайта и обеспечивают с помощью специальных программных адаптеров репликацию файлов защищаемых виртуальных машин. Список защищаемых виртуальных машин и детальные планы их аварийного восстановления определяются заранее с помощью специального функционала SRM.
VMware Site Recovery Manager
На рисунке выше представлена схема функционирования основного и резервного сайтов, работающих в системе аварийного восстановления под управлением SRM. Часть виртуальных машин основного сайта включены в защищаемые группы и для них разработан план аварийного восстановления. SRM со стороны основного сайта посредством адаптера SRA определяет, какие LUN реплицируются, и позволяет создавать защищаемые группы (Protection Group) только для тех виртуальных машин, которые хранятся на реплицируемых LUN. При этом реплицируемый LUN основного сайта находится в режиме «чтение-запись», а соответствующий LUN резервного сайта в режиме «только чтение». Оператор резервного сайта следит за состоянием основного сайта в реальном времени помощью подсистемы мониторинга SRM, которая позволяет задавать различные тревоги и оповещения.
В случае возникновения экстренной ситуации на основном сайте, требующей немедленного аварийного восстановления защищаемых виртуальных машин, оператор инициирует исполнение плана восстановления нажатием одной кнопки.
VMware Site Recovery Manager
SRM прерывает репликацию, переводит резервный LUN в режим «чтение-запись» и выполняет все предопределенные шаги восстановления. Администратор контролирует выполнение шагов плана восстановления через VirtualCenter и может в любой момент приостановить этот процесс. В результате все защищаемые виртуальные машины восстанавливаются даже при полном уничтожении основного сайта.
SRM позволяет защищать виртуальные машины каждого сайта, в котором он работает. Каждый сайт может являться и резервным и резервируемым одновременно.

Тестирование аварийного восстановления

Для тестирования созданных планов восстановления SRM создает изолированное тестовое окружение на резервном сайте, не затрагивая при этом работу производственных систем. На системе хранения создается инкрементальный снапшот реплицируемого LUN (если система хранения умеет делать инкрементальные снапшоты), который используется для тестового запуска защищаемых виртуальных машин. Для избежания конфликтов с основными системами используется специальная изолированная сеть VLAN.
VMware Site Recovery Manager

После успешного прохождения теста SRM удаляет все временные объекты и приводит резервный сайт в исходное состояние. Результаты тестирования сохраняются для дальнейшего просмотра и экспортирования.




 
 
 
 
Поиск по сайту
Google Поиск


Яндекс поиск
 
 
Полезное
 
 
 
 
 
systemzone.ru 2014