Подробно с доступностью в VMware vSphere

{title}

В зависимости от того, насколько мощное у нас оборудование и какие ресурсы необходимы для наших систем, у нас будет среднее соотношение виртуальных машин на сервер.

Возьмем, к примеру, плановое обслуживание сервера в вычислительном центре. Несколько лет назад, если бы это не было частью кластера, система, содержащаяся в оборудовании, была бы отключена, в результате чего пользователи также были бы затронуты, и / или персонал, участвующий в техническом обслуживании, должен был работать в ограниченные временные рамки сказать неудобно).

В случае виртуализированной среды виртуальные машины могут просто «перемещаться или мигрировать» к другому члену кластера, и можно выключить компьютер для работы на нем. Проблема решена

Давайте начнем видеть ситуации, когда отсутствие обслуживания не запланировано.

Мониторинг виртуальных машин и приложений
Каждый раз, когда мы создаем виртуальную машину, рекомендуется устанавливать сборник приложений и драйверов, которые оптимизируют поведение виртуального оборудования в целом (доступно для Windows, Mac OS, Linux и других ОС). Эти инструменты, называемые VMTools, среди прочего включают в себя возможность для хоста контролировать виртуальную машину (с помощью пульса, например в кластерах). Если вы не ответите в течение определенного периода, перезапустите операционную систему.

Аналогичный случай происходит с мониторингом приложений, но сначала необходимо получить соответствующий SDK (или использовать приложение, которое поддерживает мониторинг приложений VMware).

Но ... что произойдет, если неисправность аппаратная?

Вышеупомянутый кластер является первым слоем решения.

Общее хранилище

Где все члены кластера имеют доступ к виртуальным машинам.

Сетевое объединение

В случае отказа пластины, остальные продолжают управлять трафиком.

Несколько путей (многолучевое распространение)

Для хранения они не только оптимизируют доступ, но и обеспечат вам избыточность.

Вообще говоря, эти три технологии уменьшают время, когда наша информация недоступна. Теперь, в зависимости от имеющейся у нас лицензии, у нас также могут быть две очень интересные функции: высокая доступность (HA) и отказоустойчивость (FT).

В обоих случаях нам нужен кластер с общим хранилищем. Без необходимости устанавливать дополнительное программное обеспечение можно включить и настроить HA таким образом, чтобы в случае сбоя сервера или виртуальной машины в кластере он автоматически запускался на другом его члене. Стоит уточнить, что HA не предназначен для критически важных виртуальных машин (виртуальных машин). Таким образом, расчетное время без обслуживания будет: «Запуск операционной системы + запуск служб».

Количество сбоев хоста, поддерживаемых кластером
У нас есть X виртуальных машин, распределенных по Y серверам в кластере.

Сколько хостов может выйти из строя, не влияя на доступность и производительность нашей виртуальной среды?

Можно настроить HA для поддержки определенного количества сбоев сервера, гарантируя, что в восстановлении остается достаточно ресурсов.

HA разделяет доступные ресурсы кластера на части, принимая во внимание ЦП и ОЗУ, настроенные и потребляемые нашими виртуальными машинами очень консервативным способом. Возьмите самый большой сконфигурированный пул ЦП среди всех ВМ на каждом хосте в кластере, а затем самый большой пул памяти и его избыток. Если нет сконфигурированного резервирования, потребуется минимум 32 МГц на ВМ для ЦП и 0 МБ ОЗУ + ее избыток.

С этими числами предполагается, что каждая виртуальная машина будет использовать этот процессор и память, а затем генерирует значение, называемое размером слота. С помощью этого значения определяется, сколько слотов доступно / используется каждым хостом.

$config[ads_text5] not found

{title}

Проблема возникает, когда, например, у нас есть только одна машина с большим резервом процессора и памяти. Принимая настроенное резервирование, очень вероятно, что остальным нашим виртуальным машинам эти ресурсы действительно не нужны, что приводит к меньшему количеству слотов для нашего кластера.

Процент ресурсов кластера в качестве емкости для сбоев
В отличие от предыдущего варианта, это очень хорошо работает, если у вас есть виртуальные машины с сильно изменяющимися конфигурациями процессора и памяти.

Можно отдельно настраивать процентные значения ЦП и памяти, что делает их еще более гибкими и, следовательно, экономит ресурсы. Обычно это предпочтительный способ настройки HA.

$config[ads_text6] not found

Хосты для аварийного переключения
Это типичная конфигурация резервного кластера. Эта опция в основном предоставляется, поскольку некоторые организации поддерживают политики, которые указывают, что должны быть серверы, ожидающие любую катастрофу. Поскольку VMware обеспечивает хорошее управление отказоустойчивостью, возможно, этот вариант будет подходящим вариантом при наличии достаточного количества ресурсов.

$config[ads_text5] not found ...

Но это определенно не самый лучший.

vMotion: живые миграции
Динамическая миграция позволяет перемещать действующие виртуальные машины с одного физического сервера на другой, сохраняя при этом сетевое соединение и идентичность. Активная память (запущенные процессы) передается через высокоскоростную сеть. Весь процесс занимает менее 5 секунд в гигабитной сети.

Можно переместить виртуальную машину, файлы, которые она использует, или и то, и другое, и процедуру можно выполнить, когда машина включена или выключена. В последнем случае мы называем это «холодной миграцией», а если машина работает, мы будем называть ее vMotion.

Использование и преимущества vMotion

  • Реорганизация виртуальных машин, что позволяет оптимизировать ресурсы. Удалите их с серверов с ошибками или насыщенными тенденциями.
  • Автоматическая оптимизация доступных ресурсов (работает совместно с Dynamic Resource Scheduler или DRS).
  • Поддерживать базовую инфраструктуру без необходимости технического обслуживания или прерывания работы.

$config[ads_text5] not found

Каждый из компонентов состояния виртуальной машины обрабатывается по-разному во время миграции. Общая конфигурация самая простая, она не перемещается, а создается заново на конечном компьютере.

Поскольку диск не может быть воссоздан за такое короткое время, необходимо иметь общее хранилище. Текущее состояние памяти постепенно копируется на хост назначения, в конце копии сравниваются существующие различия, возникшие во время миграции, состояние исходной виртуальной машины замораживается и операционная система активируется на целевой виртуальной машине.

Поскольку в некоторых случаях вариант перезапуска машины не идеален, для критически важной миссии у нас есть Fault Tolerance . Что желательно в этих случаях, это ни в коем случае не переставать работать, даже если ваш хост не работает. Единственный способ сделать это возможно, если виртуальная машина работала в двух местах одновременно. Он настроен на уровне виртуальной машины и будет генерировать точную копию виртуальной машины, постоянно сохраняя ее репликацию на 100% на другом сервере, поэтому в случае сбоя оборудования ваш близнец просто продолжит функционировать без потери какой-либо информации. Интересное право?

$config[ads_text5] not found

{title}

Если бы были задействованы только ресурсы, мы бы включили FT на всех виртуальных машинах в нашем компьютерном центре, но в предыдущих версиях vSphere у нас были некоторые ограничения, самое важное: было невозможно включить FT на машинах, которые использовали более одного виртуального процессора, К счастью, в последней версии продукта он поддерживает до 4 виртуальных процессоров одновременно на защищаемую машину, однако необходимо учитывать лицензирование:

Количество виртуальных ЦП, поддерживаемых виртуальной машиной с включенным FT, ограничено уровнем лицензирования, приобретенным для vSphere.

Отказоустойчивость поддерживается следующим образом:

  • vSphere Standard и Enterprise. Это позволяет до 2 виртуальных ЦП.
  • vSphere Enterprise Plus. Это позволяет до 4 виртуальных ЦП.

Это не единственное требование системы.

хранение

Виртуальные машины должны иметь общее хранилище. Невозможно использовать физический RDM (Raw Devide Mapping).

сеть

Необходимо иметь как минимум две виртуальные платы (vmnics), одну для vMotion и другую (10 Гбит / с) для FT Logging. Это новое требование версии 6 (ранее требовались пластины 1 Гбит / с)

процессор

Процессоры и операционные системы должны быть совместимы с FT (и среди них).

ограничения

  • Невозможно сделать снимки виртуальных машин, которые защищены с помощью FT, и они должны быть удалены перед включением этой функции.
  • Виртуальные диски (VMDK) больше 2 Тб.
  • В документации VMware есть список конкретных устройств и функций.

$config[ads_text5] not found

Кроме того, существует ограничение на количество виртуальных машин на сервер: максимум 4 защищенных машины на хост или 8 защищенных виртуальных ЦП (до того уровня, который был достигнут первым). Эти максимумы включают основной и дополнительный компьютер (и vCPU)

Различия между наследием FT (предыдущим) и текущим

IPv6

 Legacy FT = не поддерживается сетевыми платами, настроенными на ведение журнала FT FT = поддерживается 

API VStorage - резервное копирование с защитой данных

 Legacy FT = не поддерживается FT = поддерживается 

Виртуальный диск

 Legacy FT = EZT (Eager Zeroed Thick) FT = Все типы, включая толстые и тонкие 

Резервирование vmdk (виртуальный диск)

 Legacy FT = единичная копия FT = Первичный и вторичный аппарат хранят независимые копии, что позволяет хранить их в разных хранилищах данных и увеличивать избыточность 

$config[ads_text5] not found

Пропускная способность сетевой платы

 Legacy FT = Рекомендуется выделенный сетевой адаптер на 1 Гбит FT = Рекомендуется выделенный сетевой адаптер на 10 Гбит 

Совместимость процессора и хоста

 Legacy FT = Требуется та же модель процессора и семейства. Практически идентичные версии vSphere FT = CPU должны быть совместимы с vSphere vMotion или EVC. Версия vSphere должна быть совместима с vSphere vMotion 

Активировать / деактивировать FT при работающей машине

 Legacy FT = не всегда поддерживается FT = поддерживается 

Помните, что FT защищает от сбоя оборудования сервера, а не от сбоев операционной системы или приложений.

vCenter Server Watchdog - это встроенная функциональность версии 6.x. Периодически проверяйте состояние служб, составляющих vCenter, перезапускайте процессы администрирования или виртуальную машину, если это необходимо.

$config[ads_text6] not found

{title}