Новый рывок производительности NVIDIA GPU
Из обширной программы осенней конференции NVIDIA GTC 2022 Fall народное внимание выхватило анонс пользовательских акселераторов RTX 4080 и 4090 - не обсуждать же программное обеспечение, среду разработки и профессиональные GPU. Но именно платформы NVIDIA для дата-центров обеспечивают постоянный прирост производительности сверх закона Мура, а приложения HPC/AI получают новые прорывные возможности.
Новинки построены на графическом процессоре Ada Lovelace, который пришел на смену ядру Ampere и, пишут, в разы поднимет продуктивность в ряде прикладных задач. Все объявленные массовые и специализированные акселераторы начнут отгружаться в четвертом квартале 2022, включая топовый H100 из еще весеннего анонса.
Небожители и миряне
Весной этого года NVIDIA подняла ставки в центрах обработки данных, представив новую архитектуру Hopper и графический процессор H100 для рабочих нагрузок высокопроизводительных вычислений и искусственного интеллекта. H100 производится по технологии TSMC 4 нм, в нем 80 миллиардов транзисторов — на 68 процентов больше, чем у 7 нм графического процессора A100 предыдущего поколения (Ampere). H100 — первый графический процессор с поддержкой PCIe Gen5, первый c использованием HBM3 и пропускной способностью памяти 3 ТБ/с.
Ускоритель выпускается в двух форм-факторах: SXM5 с памятью 80 ГБ HBM3 и заявленным TDP 700 Вт, и в виде карты расширения PCIe 5.0 c 80 ГБ памяти HBM2e и энергопотреблением 350 Вт.
H100 ускоряют обучение до 9 раз, инференс до 30 раз, приложения HPC до 7 раз, по сравнению с предыдущим поколением A100.
Пока что есть только оценочные суждения о будущей цене H100, но можно предположить, что топовые акселераторы будут дороже нынешнего флагмана A100 (~$15K) сообразно приросту производительности.
При таком разлете цен NVIDIA реалистично смотрит на рынок и оставляет (не снижая прайса) в производстве A100 – для плотного заполнения продуктовой вертикали. Не потому что есть пользователи «богатые» и «бедные», а из-за расслоения спроса. Похоже, NVIDIA разделяет свои графические процессоры на те, которые в предназначены для масштабных вычислений HPC/AI (H100 и отчасти A100) и те, чти в первую очередь предназначены для ускорения графики. Ниже A100 в текущей линейке GPU для рабочих станций и серверов располагались A6000 (с активным охлаждением) и A40 (с пассивным охлаждением – для дата-центров). Им на смену идут RTX 6000 и L40. Остановимся на них подробнее – как продуктах, которые войдут и в нашу неритмичную жизнь.
RTX 6000
Маркетологи NVIDIA чудят с неймингом. Надо быть бдительным, чтобы не спутать RTX 6000 Ada с одним из его предшественников:
- NVIDIA Quadro RTX 6000 (архитектура Turing)
- NVIDIA RTX A6000 (Ampere)
- NVIDIA RTX 6000 (Ada Lovelace)
Инженеры, напротив, показали класс: этот GPU с 48 ГБ памяти ECC занимает два слота и потребляет всего 300 Вт – против 450 Вт у трехслотового игрового RTX 4090 с 24 ГБ non-ECC.
Servethehome собрал характеристики RTX 6000 Ada в одну таблицу:
Сама NVIDIA не жалует подробностями на своем сайте, ограничиваясь общими сравнениями RTX 6000 Ada с предшественником RTX A6000. Как и A100, A6000 тоже остаются в производстве. В отличие от сменщиков, A6000 можно спаривать мостиками NVLink – в задачах, где есть эффект от объединения пространств графической памяти.
L40
Этот GPU по характеристикам идентичен RTX 6000 Ada, только идет с пассивным охлаждением и предназначен для дата-центров – высокоплотных GPU-серверов. Как и у предшественника A40 (Ampere), у него 48 ГБ графической памяти ECC и энергопотребление 300 Вт.
L40 вытеснит A40 производительностью: обещают двукратное ускорение трассировки лучей против поколения Ampere.
The winner takes it all
Геймеры остались недовольны тем, что видеокарты RTX 4090 заявлены значительно дороже, чем стоили топовые модели предыдущего поколения в момент их появления. Они ссылаются на закон Мура – по сути, эмпирическое наблюдение об удвоении количества транзисторов процессоров за два года, при одновременном падении цены с повышением производительности. Глава NVIDIA Джесен Хуанг заметил на это, что «закон Мура мертв», в новой реальности старые ожидания не работают и не стоит рассчитывать, что видеокарты будут дешеветь со временем. В еще большей степени это относится к инструментам бизнеса.
Недовольны не только конечные пользователи. В середине сентября ведущий производитель видеокарт EVGA подал на развод. Компания заявила, что прекращает сотрудничество с NVIDIA из-за «неуважительного отношения» спустя более 20 лет партнерства. Руководство EVGA утверждает, что NVIDIA не делилась информацией о продуктах и не предоставляла обновляемую информацию для инженеров в оперативном режиме. Свое будущее EVGA видит в бизнесе блоков питания и материнских плат – более предсказуемом и прибыльном.
Последнее многое объясняет. Динамика распределения прибыли между NVIDIA и ее производственными партнерами показывает, куда идет компания – к консолидации разработки и продаж.
Источник: Anandtech
Всякий прогресс имеет свою цену.
При подготовке использованы материалы NVIDIA