Новый рывок производительности NVIDIA GPU

26.09.2022 | Серверы

Из обширной программы осенней конференции NVIDIA GTC 2022 Fall народное внимание выхватило анонс пользовательских акселераторов RTX 4080 и 4090 - не обсуждать же программное обеспечение, среду разработки и профессиональные GPU. Но именно платформы NVIDIA для дата-центров обеспечивают постоянный прирост производительности сверх закона Мура, а приложения HPC/AI получают новые прорывные возможности.

Новинки построены на графическом процессоре Ada Lovelace, который пришел на смену ядру Ampere и, пишут, в разы поднимет продуктивность в ряде прикладных задач. Все объявленные массовые и специализированные акселераторы начнут отгружаться в четвертом квартале 2022, включая топовый H100 из еще весеннего анонса.

Небожители и миряне

Весной этого года NVIDIA подняла ставки в центрах обработки данных, представив новую архитектуру Hopper и графический процессор H100 для рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта. H100 производится по технологии TSMC 4 нм, в нем 80 миллиардов транзисторов — на 68 процентов больше, чем у 7 нм графического процессора A100 предыдущего поколения (Ampere). H100 — первый графический процессор с поддержкой PCIe Gen5, первый c использованием HBM3 и пропускной способностью памяти 3 ТБ/с.

Ускоритель выпускается в двух форм-факторах: SXM5 с памятью 80 ГБ HBM3 и заявленным TDP 700 Вт, и в виде карты расширения PCIe 5.0 c 80 ГБ памяти HBM2e и энергопотреблением 350 Вт.

H100 ускоряют обучение до 9 раз, инференс до 30 раз, приложения HPC до 7 раз, по сравнению с предыдущим поколением A100.

Пока что есть только оценочные суждения о будущей цене H100, но можно предположить, что топовые акселераторы будут дороже нынешнего флагмана A100 (~$15K) сообразно приросту производительности.

При таком разлете цен NVIDIA реалистично смотрит на рынок и оставляет (не снижая прайса) в производстве A100  – для плотного заполнения продуктовой вертикали. Не потому что есть пользователи «богатые» и «бедные», а из-за расслоения спроса. Похоже, NVIDIA разделяет свои графические процессоры на те, которые в предназначены для масштабных вычислений HPC/AI (H100 и отчасти A100) и те, чти в первую очередь предназначены для ускорения графики. Ниже A100 в текущей линейке GPU для рабочих станций и серверов располагались A6000 (с активным охлаждением) и A40 (с пассивным охлаждением – для дата-центров). Им на смену идут RTX 6000 и L40. Остановимся на них подробнее – как продуктах, которые войдут и в нашу неритмичную жизнь.    

RTX 6000

Маркетологи NVIDIA чудят с неймингом. Надо быть бдительным, чтобы не спутать RTX 6000 Ada с одним из его предшественников:

  • NVIDIA Quadro RTX 6000 (архитектура Turing)
  • NVIDIA RTX A6000 (Ampere)
  • NVIDIA RTX 6000 (Ada Lovelace)

Инженеры, напротив, показали класс: этот GPU с 48 ГБ памяти ECC занимает два слота и потребляет всего 300 Вт – против 450 Вт у трехслотового игрового RTX 4090 с 24 ГБ non-ECC.

Servethehome собрал характеристики RTX 6000 Ada в одну таблицу:

Сама NVIDIA не жалует подробностями на своем сайте, ограничиваясь общими сравнениями RTX 6000 Ada с предшественником RTX A6000. Как и A100, A6000 тоже остаются в производстве. В отличие от сменщиков, A6000 можно спаривать мостиками NVLink – в задачах, где есть эффект от объединения пространств графической памяти.

L40

Этот GPU по характеристикам идентичен RTX 6000 Ada, только идет с пассивным охлаждением и предназначен для дата-центров – высокоплотных GPU-серверов. Как и у предшественника A40 (Ampere), у него 48 ГБ графической памяти ECC и энергопотребление 300 Вт.

L40 вытеснит A40 производительностью: обещают двукратное ускорение трассировки лучей против поколения Ampere.

The winner takes it all

Геймеры остались недовольны тем, что видеокарты RTX 4090 заявлены значительно дороже, чем стоили топовые модели предыдущего поколения в момент их появления. Они ссылаются на закон Мура – по сути, эмпирическое наблюдение об удвоении количества транзисторов процессоров за два года, при одновременном падении цены с повышением производительности. Глава NVIDIA Джесен Хуанг заметил на это, что «закон Мура мертв», в новой реальности старые ожидания не работают и не стоит рассчитывать, что видеокарты будут дешеветь со временем. В еще большей степени это относится к инструментам бизнеса.

Недовольны не только конечные пользователи. В середине сентября ведущий производитель видеокарт EVGA подал на развод. Компания заявила, что прекращает сотрудничество с NVIDIA из-за «неуважительного отношения» спустя более 20 лет партнерства. Руководство EVGA утверждает, что NVIDIA не делилась информацией о продуктах и не предоставляла обновляемую информацию для инженеров в оперативном режиме. Свое будущее EVGA видит в бизнесе блоков питания и материнских плат – более предсказуемом и прибыльном.

Последнее многое объясняет. Динамика распределения прибыли между NVIDIA и ее производственными партнерами показывает, куда идет компания – к консолидации разработки и продаж.

Источник: Anandtech

Всякий прогресс имеет свою цену.

                                                               При подготовке использованы материалы NVIDIA