Односокетные серверы настоящего времени
C момента дебюта процессоров EPYC 7001 первого поколения Naples AMD проповедовала не так многоядерность, сколько новый подход к архитектуре процессоров и платформ х86 массового назначения: концентрацию вычислений, памяти и операций ввода-вывода на одном сокете сервера. Процессоры AMD EPYC состоят из чиплетов, которые дешевле монолитных чипов в производстве, их проще интегрировать в окружение. Ставка сыграла. Односокетная стратегия, пусть не упразднила двух- и четырехпроцессорные серверы, но обеспечила полноценную (притом, экономную) раздачу вычислительных ресурсов во многих приложениях гиперскейлеров, облачных провайдеров, HPC и AI.
Мотивы
Еще до выхода в свет второго поколения процессоров AMD EPYC 7002 Rome ряды сторонников односокетных серверов пополнили ведущие вендоры и знаковые потребители (AWS, Microsoft Azure, Dropbox). Dell CTO поясняет на десяти пальцах, почему так, в статье Why single-socket servers could rule the future:
- У CPU более чем достаточно ядер на сокет, дальше будет еще больше
- Замещение недогруженных двухсокетных серверов
- Проще попасть в бинарность каналов памяти и ее объемов (128, 256, 512…)
- Ниже расходы на кластеризацию (меньше CPU/памяти….)
- Меньше затраты на программное обеспечение в некоторых моделях лицензирования
- Уход от проблем падения производительности NUMA – ввода/вывода и памяти
- Лучше распределение тепловыделения в дата-центрах
- Переназначение контактов NUMA для других целей: каналов DDRx, PCIe или будущих шин (CxL, Gen-Z)
- Прямое подключение NVMe без коммутаторов PCIe (вообще говоря, это следует из #8)
- Gartner считает так же: Use single-socket servers to reduce costs in the data center
После активной дискуссии с потребителями и появления Rome добавились еще четыре довода:
- Отдаление надвигающихся проблем с питанием серверных стоек, уменьшающих количество серверов в стойке
- Готовность к граничным вычислениям (edge computing)
- Дешевле переход от одного поколения серверов к другому, с ростом потребности в процессорной мощности и памяти.
- Снижение сложности за счет того, что ИТ-администраторы и разработчики приложений не становятся экспертами в области ввода-вывода и памяти NUMA, а сетевой администратор избавлен от погони за призраками.
Уже больше года, как продается третье поколение процессоров AMD EPYC 7003 «Milan». Односокетный тренд только крепнет, недавнее обновление парка серверов Cloudflare тому пример.
Куда смотрит Intel?
Компания подтягивает отставание – теперь в процессорах Intel Xeon SP третьего поколения до 40 ядер (против 64 у AMD), поддержка из процессора 64 линий PCIe Gen 4 (против 128 у AMD, а было 48 x PCIe Gen 3) и восьми каналов памяти DDR4-3200 (как у AMD, было 6 x DDR4-2933).
Следуя примеру AMD, Intel выпустила несколько процессоров для односокетных систем:
Intel Xeon U-Series |
||||||
|
Ядер |
Базовая частота (GHz) |
Макс. Частота (GHz) |
Cache (MB) |
TDP (W) |
Цена |
Xeon 8351N |
36 |
2.4 |
3.1 |
54 |
225 |
$3027 |
Xeon 6314U |
32 |
2.3 |
2.9 |
48 |
205 |
$2600 |
Xeon 6312U |
24 |
2.4 |
3.1 |
36 |
185 |
$1450 |
По основным показателям (ядрам, тактовой частоте, числу шинных линий) они уступают процессорам AMD EPYC 7003P:
AMD EPYC P-Series |
||||||
|
Ядер |
Базовая частота (GHz) |
Макс. Частота (GHz) |
Cache (MB) |
TDP (W) |
Цена |
EPYC 7713P |
64 |
2.0 |
3.675 |
256 |
240 |
$5010 |
EPYC 7543P |
32 |
2.8 |
3.7 |
240 |
$2730 |
|
EPYC 7443P |
24 |
2.85 |
4.0 |
128 |
200 |
$1337 |
EPYC 7313P |
16 |
3.0 |
3.7 |
180 |
$913 |
Дополнительных производственных затрат «односокетные» процессоры не требуют – их получают из старших собратьев отключением межпроцессорного интерфейса. Продают их дешевле, но если бы дело было только в цене CPU.
Рынок решил
Предложение односокетных серверов на процессорах Intel Xeon SP второго и третьего поколения было и остается скудным. Их не найти в каталогах А-бренд. Считай, на этом фронте воюет только Supermicro - та старается покрывать вообще все мыслимые серверные сегменты. Но даже ее собственная таблица позиционирования не убеждает в необходимости двухпроцессорных серверов. Скорее, выгодно подает односокетные системы (и не сказать, что Intel):
Workload |
Single Socket |
Dual Socket/Quad Socket |
Database |
Good for SMB |
Best for Enterprise |
OLTP |
Suitable for SMB and Enterprise |
Excellent for Enterprise |
Financial/Accounting |
Excellent for SMB & Enterprise |
|
ERP |
Excellent for SMB, Good for Enterprise |
Excellent for Enterprise (Training) |
HPC |
Suitable for small models. Low scalability (multiple servers) |
Excellent; multiple servers may be needed |
EDA |
Excellent for chip simulations |
Better for MCAE applications |
AI/ML |
Good for small models |
Excellent with multiple GPUs |
Real-time analytics |
Good for small queries |
Excellent for large data or multiple simultaneous users |
Software Development |
Suitable for small to medium sized groups |
Better for larger projects |
Edge Processing |
Excellent for on-location |
Excellent for data centers, distributed |
Content Delivery |
Excellent |
|
Storage systems |
Good for SMBs |
Excellent for large enterprises |
Firewall Protection |
Excellent based on inbound traffic |
|
Gaming |
Excellent |
A large number of clients |
Односокетные серверы на AMD EPYC предлагают все лидеры рынка (примеры: Dell PowerEdge R6515, HPE ProLiant DL325, Lenovo ThinkSystem SR635 Rack) и «народные» вендоры (ASUS, Gigabyte, Supermicro, Tyan). Получается, мало кто верит в способность Intel отбить натиск AMD в нижнем и среднем сегментах. Почему так?
Intel давно воспринимается как консервативная компания, ее апологеты - такие же. Мифы, о которых пишет AMD («два сокета надежнее одного, всегда производительнее и вообще лучше») питаются отсутствием экспертизы, нежеланием читать и боязнью перемен. Вендоры, зная своих потребителей, продолжают привычно штамповать двухпроцессорные системы Intel Xeon. Хотите – ставьте в них «односокетные» процессоры, они будут работать (переплата за неиспользуемый второй сокет и потеря части слотов, которые обслуживает второй CPU – не в счет).
Драйвером перемен сегодня является малый и средний бизнес, особенно в таких областях, как граничные вычисления и системы искусственного интеллекта. Типовые односокетные серверы для сбора и первичной обработки данных, обучения систем, интеграции рабочих процессов берут ценой и достаточной производительностью.
В небе и на земле
Ответ на вопрос Is the shift to single-socket servers starting? утвердительный. AWS использует однопроцессорные машины Graviton и Gravition2 в своем обширном парке серверов EC2. Google развертывает свои экземпляры Tau в Google Cloud на основе односокетного серверного узла Milan EPYC 7003, чтобы снизить затраты и повысить производительность. При этом Google заявляет, что односокетный 60-ядерный сервер EPYC может предложить на 56% более высокую производительность и на 42% лучшую отдачу от затраченных средств, чем AWS может сделать с его односокетными узлами Graviton2.
Гиперскейлеры, операторы масштабных проектов ИИ- и HPC-проектов разрабатывают и внедряют собственные процессоры под свои же приложения. Сторонним оценщикам сложно сравнивать аппаратные платформы ввиду их «заточки» под определенные типы рабочих нагрузок. Когда они это делают (Amazon Graviton 3 vs Intel Xeon vs AMD EPYC performance или AWS EC2 m6 Instances Wht Acceleration Matters), главный вывод подобных исследований – что мир CPU меняется на глазах, а расшифровка производительности становится все более привязанной к специфике задач. Когда поставщики облачных услуг говорят об ускорителях, они ссылаются на избранные нагрузки – те, где могут показать невероятный прирост. В реальных задачах картина совсем другая. Описать различия, наблюдаемые при использовании ускорителей на разных платформах – большая проблема.
Кроме того, облачные провайдеры, производя свои собственные чипы, привязывают пользователей к облаку и делают рабочие нагрузки непереносимыми к другим поставщикам. А клиенты хотят мобильности. Многие строят гибридные облака и желают видеть частную и публичную части облачной инфраструктуры построенными на платформах сходной архитектуры.
В реальном мире серверного железа x86 пока что остается земным стандартом, нам же - выбирать между Intel и AMD. На стороне AMD cильная, последовательная стратегия одного сокета.