Бережливость в серверах

Рынок серверов сопротивляется унификации – нагрузки, среда, требования – у всех разные. Однако из-за сложности предмета господствует мысль, что главное в серверном деле – выбрать бренд («Dell плохого не предложит»). К счастью, кроме религиозных догматиков и мотов бюджета, есть много пользователей, которые понимают: решают не имена, а технологии – именно они позволяют сделать больше меньшими средствами.
Один сокет вместо двух
За пять поколений процессоров EPYC доля AMD на серверном рынке выросла примерно с 2% до 34%. Начиная с дебюта Naples в 2017 году AMD последовательно развивает сегмент односокетных серверов. Тогда стандартным выбором были двухпроцессорные серверы – из-за традиционных требований платформ Intel к вычислительной мощности, вводу/выводу и объемам памяти. В то же время до 35-40% серверов продавалось «одноногими», только с одним процессором. Второй почти никогда не докупался.
Привлекательность альтернативы очевидна: большое количество ядер процессоров AMD EPYC, многоканальные контроллеры памяти и щедрый запас линий PCIe позволяют сконцентрировать вычисления вокруг одного процессора. Это обеспечивает гибкое, экономное и энергоэффективное распределение ресурсов. Меньше компонентов – более простой дизайн системной платы, следовательно, более высокая надежность. Снижение энергопотребления и упрощенное охлаждение уменьшают затраты на эксплуатацию.
Современные однопроцессорные решения на 5 поколении процессоров AMD EPYC предлагают до 192 ядер, 128 линий PCIe 5.0 и до 6 ТБ оперативной памяти – большой запас производительности и масштабируемости.
Односокетные платформы AMD EPYC уже много лет присутствуют в портфелях Dell Technologies, Hewlett Packard Enterprise, Lenovo и других производителей.
Intel долго игнорировала этот сегмент, не имея аналогичных технологий. Если AMD быстро «заразила односокетностью» весь рынок, то Intel совершенствовала процессоры Xeon Scalable в течение пяти поколений, пока соблазнила тех же производителей похоже. Новое семейство Xeon 6 с производительными P-ядрами предлагает достаточную вычислительную мощность и количество линий PCIe для ввода/вывода. Это распространило однопроцессорный тренд и на платформы Intel. Серверы Dell Poweredge R470/R570 и HPE ProLiant Compute DL320/DL 340 Gen12 тому пример.
NVMe вытесняют SATA SSD из серверов
Преимущество NVMe над SATA SSD в работе с «горячими» данными не вызывает никаких сомнений. NVMe значительно быстрее по всем ключевым показателям – задержкам, количеству IOPS (в разы), потоковой скорости (на порядок). Разница настолько очевидна, что уже многие годы никто не сталкивает NVMe и SATA SSD в тестовых средах. Когда-то, на заре распространения NVMe, такое сравнение имело просветительский смысл – как в этом исследовании времен PCIe Gen 3. Под нагрузкой OLTP (онлайн-обработки транзакций Microsoft SQL), пара NVMe выполнила в 2.5 раза больше транзакций чем восемь SATA SSD, с задержкой ниже на 25%.
С каждым новым поколением шины PCIe производительность NVMe продолжает расти, тогда как SATA SSD давно уперлись в физический потолок возможностей. Когда-то сетовали на дороговизну NVMe, но сегодня при одинаковой емкости накопители NVMe стоят на 20-25% дешевле, чем SATA SSD.
Почему же при таких очевидных преимуществах в транзакционных серверах до сих пор в ходу SAS/SATA SSD, і даже SAS HDD 10K rpm?
Не отпускает прошлое.
RAID-контроллеры десятилетиями служили основой для построения дисковых массивов. Но, с появлением NVMe, с их миллионами IOPS и гигабайтами пропускной способности на один носитель, стало ясно: главное узкое место – это сам контроллер и его канал подключения к шине PCIe.
Идея убрать RAID-контроллер с прямого пути данных к NVMe SSD логична, но на практике ведет в «сад расходящихся тропок»: множество программно-определенных решений для управления и защиты данных, каждое из которых привязано к определенной среде. Простого универсального заменителя аппаратному RAID-контроллеру пока нет.
Добавим сюда еще требования систем виртуализации, совместимость с SAS-экосистемой, привычные инструменты мониторинга – и становятся понятны причины топтания на старом поле SAS/SATA SSD.
Искусство умеренности
Разнообразие серверных процессоров сегодня впечатляет - от гигантов с сотней ядер и терабайтами оперативной памяти до компактных решений, потребляющих в несколько раз меньше энергии. Однако не каждый сервер должен быть флагманом.
Многие задачи в корпоративных средах не требуют ни десятков каналов памяти, ни сотен линий PCIe. Контроллеры доменов, серверы управления, узлы мониторинга, хранилища резервных копий или просто серверы малого бизнеса отлично работают с умеренным вычислительным потенциалом.
Ценность умеренности состоит в том, чтобы не переплачивать за избыточные ресурсы, выбирая базовую серверную платформу, оптимизированную по стоимости владения и энергопотреблению.
Новая серия процессоров AMD EPYC 4005 создана именно для таких сценариев. Она сохраняет ключевые черты серверных процессоров AMD – архитектуру Zen 5, поддержку ECC-памяти и серверных функций безопасности – в компактном, энергосберегающем формате. По сравнению с традиционными Intel Xeon E или даже младшими моделями Xeon Scalable, EPYC 4005 предлагает больше ядер, более высокую эффективность на ватт и меньшую цену за производительность. Платформы под эти процессоры тоже дешевле.
По сравнению с EPYC 9005 линейка 4005 лишена таких характеристик как многоядерность, 12-канальная память и множество линий PCIe 5.0, которые в офисном или периферийном сервере просто не используются. Минимализм в железе здесь не порок, а разумный баланс между потребностью и возможностью. Умеренность как осознанный выбор – там, где нагрузка стабильна, а масштаб вычислений прогнозируемый.
Отдельного котла в аду заслуживают проповедники серверов "с запасом на вырост". Неспособность сопоставить реальные нагрузки с необходимыми ресурсами подталкивает и продавцов и покупателей маскировать неуверенность чрезмерной мощностью – какой они ее представляют. «Запас карман не тянет» — обычно ошибочный аргумент: платишь за излишек сегодня, а пригодится ли он послезавтра – большой вопрос. В сегодняшних условиях стремительный рост компаний маловероятен. А если он и произойдет, технологии за это время продвинутся настолько вперед, что выгоднее будет приобрести новый сервер, чем латать старый.
«Что не в убыток, то в прибыль»
Не обязательно ссылаться на известные концепции менеджмента – как кайдзен («непрерывное усовершенствование») или Lean («бережное производство»). Достаточно здравого смысла. Системный подход к оптимизации бизнес-процессов, непрерывное стремление к устранению всего, что не прибавляет ценности – это нормальная практика компаний, живущих за свой счет, не дядин.
