Примерочная прогресса

15.11.2022 | Решения

Только что представленное поколение серверных процессоров AMD EPYC 9004 под кодовым названием Genoa поддерживает DDR5 и PCIe 5, потолок по ядрам на сокет стал выше на 50% против предшественника Milan - до 96, в полтора раза увеличилось число каналов памяти. Genoa (а также следующее поколение Bergamo со 128 ядрами на сокет, запланированное на середину 2023 года) – это ответ AMD на угрозу серверных процессоров Arm. Но, что хорошо гиперскейлерам, то лишнее в локальных центрах обработки данных. Многие клиенты не внедрят новые платформы – они избыточны и как следствие дороги.
 
У производительности всегда есть другая сторона – цена производительности. К примеру, память DDR5 конструктивно сложнее, чем DDR4, на ней есть управление питанием. Это, а также переход на новое производственное поколение, означает, что цены DDR5 гораздо выше. Для Genoa каждый DIMM стоит на 50% больше, чем у Milan с DDR4. Если заполнять все 12 каналов памяти против 8 в Milan, будет еще дороже.
 
Наибольшая разница между этим запуском и предыдущими сводится к позиционированию. AMD не предлагает единый дизайн для всего рынка и не призывает переходить на новую платформу всех. Вместо этого AMD будет иметь сегментные решения. Многие клиенты останутся с Milan в следующем году. Для односокетных 16-32-ядерных серверов Genoa избыточна.
 
То же можно наблюдать на рынке графических процессоров, где тон задает NVIDIA. Ее нынешний топовый акселератор H100 (Lovelace) для рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта ускоряет обучение до 9 раз, инференс до 30 раз, приложения HPC до 7 раз по сравнению с предыдущим поколением A100 (Ampere). Но H100 втрое дороже A100. Передовые нейросетевые тренеры оценят новинку – прирост их производительности кратно превысит удорожание. Большинству корпоративных пользователей возможностей Ampere хватает с головой – поэтому NVIDIA не спешит пересаживать свои промышленные линейки на архитектуру Lovelace. Все флагманы времен Ampere (A100, A6000/A40, A5000/A30) остаются в производстве.
 
Ранее серверный рынок работал в режиме линейного вытеснения – планомерно и полностью переходил с одного поколения процессоров/платформ на новое, получая улучшенные возможности (новый техпроцесс, больше ядер и каналов памяти, выше частоту) примерно по цене старого железа. Распад рынка на сегменты с высокой степенью специализации оправдывает одновременное сосуществование платформ нескольких поколений. Пользователи не спешат примерять на себя обещанный прирост производительности и переплачивать за умозрительные улучшения в избранных приложениях – потому что они не соотносятся с их нагрузками. За что платить больше и почему нужно менять шило на мыло? К примеру, никогда ранее серверный рынок не саботировал переход так, как смену Intel Xeon Scalable второго (Cascade Lake) на третье (Ice Lake) поколение.
 
В экономике с затянутыми поясами иначе и не должно быть. Любые капитальные затраты должны быть оправданы определенной моделью окупаемости. Мода модой, но мы носим то, что подходит по размеру.