Кластер «на минималках»

Изменения к худшему в лицензировании Broadcom-VMware заставили небольшие предприятия искать альтернативные средства виртуализации и обеспечения непрерывности – малые компании стремятся к доступности данных серверной инфраструктуры так же, как и большие. Основным вариантом для таких клиентов является виртуальная среда (VE) Proxmox, а приемлемым решением высокой доступности – HA-кластер Proxmox VE/StarWind VSAN, который можно собрать даже из двух серверов. Вклад в нем StarWind VSAN – реализация совместного для нод кластера виртуализированного хранилища данных (shared storage).

Почему StarWind VSAN ?

Proxmox включает в себя Ceph как программно-определямое решение для хранения данных. Ceph имеет открытый код и предлагает богатый набор функций. Однако малым компаниям обычно достаточно двух узлов кластера. Скромный масштаб ограничивает достоинства Ceph: параллелизацию рабочей нагрузки, стойкость, самовосстановление, высокую доступность. Кроме того, малому бизнесу не хватает опытных администраторов для эффективной настройки, оптимизации и обслуживания Ceph. Идеальный для развертываний с размахом, Ceph слишком сложный и избыточный для сред с ограниченными ресурсами и бюджетом.

У Microsoft есть собственное гиперконвергентное решение с распределенным хранилищем Windows Storage Spaces Direct (S2D). Оно подходит средним и крупным организациям, требует минимум трех полноценных узлов и покупки дорогостоящей ревизии Windows Server Datacenter на каждый узел. Чем дальше, тем больше Microsoft фокусируется на интегрированных с собственным облаком решениях Azure Stack HCI и гибридных сценариях. Azure Stack HCI работает на ограниченном круге серверов и продается по подписке, в то время как Windows Server имеет традиционное лицензирование.

StarWind VSAN выгодно отличается совместимостью со всеми основными системами виртуализации, не требует больших вложений, обеспечивает простыми средствами совместное хранилище, живую миграцию виртуальных машин и является удачным примером бюджетного решения с нулевым временем простоя (zero-downtime).

Полноценный HA-кластер

Минимальное требование для высокодоступного (HA) кластера Proxmox VE составляет три узла. Кластер Proxmox использует демон Corosync Quorum Device (QDevice), установленный на каждом узле Proxmox, для установки кворума в случае отказа узла. Однако только два из этих узлов должны являться узлами хранения данных. Третий, свидетельский узел может быть бездисковым сервером, на котором работает только демон QDevice.

Решение выглядит так:

Пошаговая процедура настройки кластера подробно описана: https://www.starwindsoftware.com/blog/how-to-build-a-highly-available-minimalist-2-node-proxmox-ve-cluster/.

Можно ли обойтись без StarWind VSAN?

Да. Но двунодовый кластер Proxmox VE без общего хранилища (shared storage) имеет существенные ограничения:

Функция	Поддержка без shared storage
Онлайн-миграция VM (live migration)	❌ Невозможна
Высокая доступность (HA)	⚠️ Возможна только с репликацией ZFS/LVM
Оффлайн-миграция (cold migration)	✅ Возможна
Репликация VM/контейнеров	✅ Через ZFS Replication или LVM-thin

Главное: без общего хранилища невозможна онлайн-миграция, потому что виртуальный диск должен быть доступен обоим узлам одновременно – что, собственно, и обеспечивает StarWind VSAN.

Единственный способ HA в таком кластере – копирование снепшотов между узлами. Репликация ZFS (или LVM-thin) в Proxmox VE не обеспечивает нулевой задержки. Это асинхронная репликация, поэтому при падении основного узла VM запускается на втором из последнего успешно передаваемого снепшота.

Реальная задержка доступности зависит от:

Графика репликации (главный фактор)
Размера VM (больше данных – дольше копирование)
Скорости сети (~80 МБ/с по ссылкам 1 Gbit/s)
Загрузки узлов
Выбора типа хранилища (ZFS быстрее LVM)

Минимизировать задержку можно оптимизацией графика репликации в зависимости от типа операций с данными, вынесением репликации на отдельную сеть 10-25 Gbit/s, оптимизацией VM, снижением операционного объема данных, настройкой реакции QDevice на обнаружение отказа.

Решение с асинхронной репликацией подходит для:

Тестовых сред (где задержка порядка 15 мин вообще не проблема)
Бюджетных конфигураций
Онлайн-транзакций с умеренными требованиями к доступности (с оптимизацией и репликацией по сети 10-25 Gbit/s можно выйти на показатели 1-3 мин простоя).

Репликация ZFS/LVM дает задержку доступности от 1 до 15 минут. Это не HA в реальном времени, а восстановление из резервной копии (снепшота). Для сокращения простоя до 1 минуты требуется совместное хранилище (shared storage).

Выбор серверной платформы

Для серверов с умеренной нагрузкой лучше подходит серия процессоров AMD EPYC 4005 на архитектуре Zen 5. У них от 6 ядер (12 потоков) до 16 ядер (32 потоков), двухканальный контроллер памяти с поддержкой до 192 ГБ DDR5-5600, ввод-вывод по 28 линиям PCIe Gen5.

Платформа AMD EPYC 4005 сочетает высокую производительность с энергоэффективностью, имеет больше ядер по сравнению с конкурентами, Intel Xeon начального уровня, имеет большие кэш-логические буферы, отвечающие задачам с низкой задержкой, пригодна для интенсивной обработки данных.

Узлы кластера

ASUS ExpertCenter Pro ER100A B6 - удобный кандидат на роль узлов минималистического двухнодового кластера, с таким наполнением:

CPU AMD EPYC 4545P, 16 cores, 3GHz
RAM 128GB (4 x 32GB DDR5 UDIMM ECC)
1 x 480GB M.2 NVMe boot SSD
2 x 3840GB U.2 NVMe data SSD
NIC1 2 x 2.5GbE (onboard)
NIC2 2 x 25GbE

Процессорных ядер и оперативной памяти должно хватить для обслуживания виртуальных машин. Выбор носителей NVMe оправдан с точки зрения производительности и относительно небольшого объема операционных данных. Отдельная сеть для репликации 2x25GbE гарантирует сокращение времени простоя.

Малые габариты и низкое энергопотребление упрощают размещение и обслуживание такой пары серверов.

Подведем итоги

Преимущества двухнодовых бюджетных кластеров Proxmox + StarWind vSAN:

Высокая доступность	Автоматический failover VM (перезапуск на живом узле) без простоя
Бюджетность	Без дорогих SAN/NAS; использует локальные диски
Производительность	Синхронная репликация данных (RTO/RPO <1 мин), NVMe-носители
Простота	Быстрая настройка (HCI: гипервизор и хранилище); совместимость с KVM/Proxmox без лицензий VMware.

Идеально для SMB.

А если небольшой перерыв в обслуживании, задержка до 15 мин – не проблема, всегда есть дополнительный резерв экономии – на лицензиях StarWind VSAN.

Ещё публикации этого раздела