Романтика и будни последней серверной пятилетки

27.09.2022 | Серверы

 

Летом 2017 года на серверном рынке появилась настоящая конкуренция. После относительно скромной первой попытки с Opteron'ами в «нулевые» AMD выкатила новое оружие – архитектуру Zen с ее воплощением, процессорами EPYC. Intel ответила процессорами Xeon Scalable, подавая их как «наибольший прогресс центров обработки данных за десятилетие».

Архитектурный спор

Архитектура Zen поначалу разрабатывалась AMD для многоядерных серверных процессоров. Позже она попадет в настольные линейки Ryzen, Ryzen Threadripper и Threadripper Pro. В отличие от монолитного дизайна процессоров Intel, AMD избрала путь MCM (multi-chip module) – ее EPYC’и состоят из чиплетов (chiplets). Хотя это увеличивает площадь CPU, добавляет транзисторы и интерконнекты, расходы компенсируются тем, что производителю дешевле изготовить несколько небольших кристаллов, чем один огромный.

Мультичиповый дизайн поначалу получил волны критики от Intel. За последние пять лет вышло по три поколения процессоров AMD EPYC (MCM) и Intel Xeon SP (все монолиты). Ожидаемые премьеры четвертых - AMD EPYC Genoa и Intel Xeon SP Sapphire Rapids – будут MCM. Intel называет конструкцию своих процессоров плиточной (tiles). Как ни называй, сличая особенности, это конец монолитам.

Как это было. Naples против Skylake

У первых процессоров AMD EPYC Naples было до 32 физических вычислительных ядер x86, 8 каналов памяти и поддержка 128 линий PCIe 3.0 - выше показателей Intel Xeon SP первого поколения (Skylake). При разработке внутреннего интерконнекта Infinity Fabric была учтена возможность взаимодействия  с высокопроизводительными графическими подсистемами.

 

 

Intel Xeon SP 1st Gen (Skylake)

AMD EPYC Naples

Техпроцесс

14 нм

14 нм

 Сокет

LGA 3647

LGA 4094

Вычислительных ядер

До 28

До 32

Каналов памяти

6 x DDR4-2666

8 x DDR4-2666

Линий PCIe

48 Gen 3

128 Gen 3

 

AMD ушла от проектирования 4- и 8-процессорных систем. Многоядерность позволила ограничиться двухпроцессорными системами, справляющихся с большинством нагрузок дата-центров. Можно сказать, тогда же открылась перспектива односокетного будущего серверов. Его отсчет начался с процессоров, помеченных суффиксом P. Одного такого процессора с его 128 линиями PCIe достаточно для узлов горизонтально-масштабируемой инфраструктуры, графических (multi-GPU) вычислителей в системах искусственного интеллекта, визуализации дополненной реальности  или под хранение данных на десятках NVMe SSD. 48 линий одного Intel Xeon для такого мало.

Rome против Cascade Lake

Второе поколение процессоров AMD EPYC Rome получило архитектуру Zen 2  и техпроцесс 7 нм. Количество ядер на процессор выросло до 64, появилась поддержка PCIe 4.0

 

 

Intel Xeon SP 2nd Gen (Cascade Lake)

AMD EPYC Rome

Техпроцесс

14 нм

7 нм

Сокет

LGA 3647

LGA 4094

Вычислительных ядер

До 56

До 64

Каналов памяти

6 x DDR4-2933

8 x DDR4-3200

Линий PCIe

48 Gen 3

128 Gen 4

 

В дополнение к SMP-серверам Intel попыталась войти в “односокетный” бизнес, выпустив процессоры  Xeon Gold 62xxU на 20 и 24 ядер - пока AMD продавала 64-ядерные  EPYC 7702P. Рынок не отреагировал.

Milan против Ice Lake

Третье поколение процессоров Intel Xeon SP Ice Lake подтянуло технологическое отставание от AMD EPYC. Появилась поддержка 64 линий PCIe Gen 4 из процессора и восьми каналов памяти DDR4-3200.  Поменялся техпроцесс, появился новый сокет. Потолок по ядрам AMD EPYC по прежнему остался выше (64 против 40 у Intel Xeon), линий PCIe больше.

 

 

Intel Xeon SP 3rd Gen (Ice Lake)

AMD EPYC Milan

Техпроцесс

10 нм

7 нм

Сокет

LGA 4189

LGA 4094

Вычислительных ядер

До 40

До 64

Каналов памяти

8 x DDR4-3200

8 x DDR4-3200

Линий PCIe

64 Gen 4

128 Gen 4

 

P-серия процессоров AMD EPYC под один сокет продолжает оставаться мощным драйвером развития гиперконвергенции, GPU-вычислителей и NVMe-хранилищ. Группа поддержки односокетных серверов на AMD EPYC за три поколения процессоров сформировалась, окрепла и включает ведущих производителей. U-серия Xeon Gold формально в линейке Intel есть, но платформ под них на рынке практически нет. Их можно ставить в двухсокетные системы, но кому интересны серверы "с ограниченными возможностями”?

Пример сравнения актуальных процессоров применительно к односокетным  решениям, не в пользу Intel:

 

Источник ServeTheHome

Что известно про будущие премьеры?

Genoa против Sapphire Rapids

Процессоры AMD EPYC Genoa будут выпускаться по техпроцессу 5 нм. У них будет до 96 ядер, упакованных в один чип на архитектуре Zen 4, что даст 192 ядра в двухпроцессорной платформе. Появится поддержка 12 каналов памяти DDR5-5200 и двух модулей DIMM на канал, что позволит набрать до 3 ТБ системной памяти модулями по 128 ГБ. Скоростной периферии достанется 128 линий PCIe Gen 5 из одного процессора или 160 в двухпроцессорном сервере. Genoa называют «безумно быстрым чипом». Подготовка к официальному старту продаж в середине ноября идет по плану.

Выход новых Xeon, масштабируемых серверных процессоров 4-го поколения Sapphire Rapids снова задерживаются - техпроцесс 7 нм и переход на плиточную конструкцию с четырьмя кристаллами дается Intel нелегко. Общее количество ядер достигнет 60 - значительный шаг вперед по сравнению с Ice Lake-SP, но все еще сильно позади Genoa. У процессоров Intel меньше линий PCIe и резервов кэш-памяти. Предполагаемая дата показа несколько раз переносилась, количество пробных степпингов побило рекорды, а «окно запуска» планируется на середину первого квартала 2023.

Что дальше

Рыночные аналитики смотрят на рынок серверов как борьбу трех идеологий:

Arm                       побольше ядер

Intel                      ускорение под специфическими нагрузками

AMD                     продуктивность и универсальность

Идея Arm в том, чтобы, не имея лучших ядер, завоевать рынок маломощными процессорами с ускорителями. Между Arm и x86 все еще существует разрыв, который во много раз больше, чем между Intel и AMD. Но у Arm и потребитель специфический – поставщики ряда облачных услуг. Arm не стоит непосредственно сравнивать с x86 - в настоящее время большая часть корпоративного программного обеспечения в мире предназначена только для архитектуры x86, с лицензированием по количеству ядер. Для этих рынков достижение максимально возможной производительности на ядро является целью, поскольку стоимость лицензий на программное обеспечение очень высока по сравнению с оборудованием.

Intel не догонит AMD по ядрам в ближайшее время. Учитывая внимание к технологиям ускорения (QuickAssist и Crypto Acceleration тому примеры), Intel скорее всего борется за высокую производительность на ядро ​​для некоторых классов рабочих нагрузок.

 

Источник

AMD укрепляет лидерство в гонке за ядрами и каналами памяти. Добавляются ускорение AI, AVX-512, а большая кэш-память L3 поможет маскировать компромиссы чиплетной архитектуры. Продуктивность в широком круге приложений  пока кажется решающим преимуществом.

 

Источник

Скорость перемен сегодня такова, что через несколько рынок может распасться на сегменты с высокой степенью специализации - и мы получим совсем другой расклад участников.