Повышение в классе: NVIDIA RTX PRO 5000 Blackwell против RTX 6000 Ada

В 2025 году NVIDIA начала переводить все свои GPU – от мобильных чипов в ноутбуках до флагманов дата-центров – на новую архитектуру Blackwell. Для рабочих станций она представлена следующими моделями:
|
Модель |
Дата выпуска |
VRAM |
|---|---|---|
|
RTX PRO 6000 Blackwell |
Март 2025 |
96 ГБ GDDR7 |
|
RTX PRO 5000 Blackwell |
Март 2025 |
48/72 ГБ GDDR7 |
|
RTX PRO 4500 Blackwell |
Июнь 2025 |
32 ГБ GDDR7 |
|
RTX PRO 4000 Blackwell |
Июль 2025 |
24 ГБ GDDR7 |
По сравнению с архитектурой Ada Lovelace (2023) Blackwell предлагает значительные улучшения в AI-вычислениях, трассировке лучей и работе с памятью. Масштаб инженерных изменений и темпы развития впечатляют . Все RTX PRO Blackwell получили заметный прирост производительности – каждый GPU поднялся на ступеньку выше относительно предыдущих моделей. Старший представитель линейки, RTX PRO 6000 Blackwell, значительно превосходит бывшего лидера RTX 6000 Ada: он оснащен 24064 CUDA-ядрами, 752 тензорными ядрами и 96 ГБ памяти GDDR7.
Оценим высоту ступени прогресса на примере RTX PRO 5000 Blackwell. Не столь интересны преимущества над предшественницей RTX 5000 Ada (там все очевидно), как сравнение с ее современницей ступенью выше, с той же RTX 6000 Ada.
|
Параметр |
RTX PRO 5000 Blackwell |
RTX 5000 Ada |
RTX 6000 Ada |
|---|---|---|---|
|
Архитектура |
Blackwell (GB202) |
Ada Lovelace (AD102) |
Ada Lovelace (AD102) |
|
Дата выпуска |
Март 2025 |
Август 2023 |
Декабрь 2022 |
|
CUDA-ядра |
14 080 |
12 800 |
18 176 |
|
RT-ядра |
110 (4-го поколения) |
100 (3-го поколения) |
142 (3-го поколения) |
|
Tensor-ядра |
440 (5-го поколения) |
400 (4-го поколения) |
568 (4-го поколения) |
|
Память (VRAM) |
48 и 72 ГБ GDDR7 с ECC |
32 ГБ GDDR6 с ECC |
48 ГБ GDDR6 с ECC |
|
Ширина шины памяти |
384-бит |
256-бит |
384-бит |
|
Пропускная способность памяти |
1344 ГБ/с |
576 ГБ/с |
960 ГБ/с |
|
Базовая/Boost частота |
1740/2377 МГц |
1155/2550 МГц |
915/2505 МГц |
|
TDP (потребление) |
300 Вт |
250 Вт |
300 Вт |
|
Питание |
1x 16-pin |
1x 16-pin |
1x 16-pin |
|
Форм-фактор |
Двухслотовая, с активным охлаждением |
Двухслотовая, с активным охлаждением |
Двухслотовая, с активным охлаждением |
|
Интерфейс |
PCIe 5.0 x16 |
PCIe 4.0 x16 |
PCIe 4.0 x16 |
|
Порты |
4x DisplayPort 2.1 |
4x DisplayPort 1.4a |
4x DisplayPort 1.4a |
|
MIG (Multi-Instance GPU) |
До 2 инстанций (24-36ГБ) |
Нет |
До 4 инстанций (12ГБ) |
|
Цена |
~$5900 (48 ГБ) |
~$5400 |
~$8500 |
Окунемся в составляющие производительности.
Ядро CUDA
Сравнивать количество ядер CUDA разных поколений напрямую некорректно – из-за отличий в архитектуре, микродизайне, производительности и оптимизации под определенные типы нагрузок.
В архитектуре Ada Lovelace половина CUDA-ядер оптимизирована только для операций с плавающей запятой (FP32), в то время как другая половина поддерживает и FP32, и целые числа (INT32). У Blackwell все CUDA-ядра унифицированы: каждое из них может выполнять FP32 и INT32-операции с полной эффективностью. Это фактически удваивает пропускную способность INT32 на такт по сравнению с Ada – преимущество, особенно важное для алгоритмов с большим количеством целочисленных операций.
Потоковые мультипроцессоры (Streaming Multiprocessor, SM) в Blackwell также переработаны – они лучше «питают» ядра данными, повышая количество инструкций на такт (IPC) в сложных сценариях, таких как трассировка лучей или нейронные шейдеры.
Кроме того, CUDA-ядра в Blackwell уже интегрированы с тензорными блоками, что повышает эффективность в задачах AI-инференса и тренировки нейронных сетей. Для игровых сценариев это не революция, но для профессионального рендеринга существенный шаг вперед.
Количество CUDA-ядер больше не главное. Даже имея меньше ядер (14 080 против 18 176 у RTX 6000 Ada), RTX PRO 5000 Blackwell способна превосходить ее в реальных приложениях благодаря новой архитектуре и памяти GDDR7. Blackwell лучше раскрывается в AI- и смешанных нагрузках. В традиционном рендеринге прирост более скромный. Геймерам здесь ловить нечего.
Трассировка лучей ( ray tracing , RT )
Несмотря на меньшее количество RT-ядер, RTX PRO 5000 Blackwell превосходит RTX 6000 Ada в задачах трассировки лучей:
- RT-ядра 4-го поколения имеют вдвое большую пропускную способность на ядро – больше обработанных треугольников и лучей, эффективнее шумоподавление.
- Память GDDR7 с пропускной способностью 1344 ГБ/с (против 960 ГБ/с у RTX 6000 Ada) существенно уменьшает задержки при работе с большими сценами.
- RTX Mega Geometry обеспечивает поддержку до 100× большего количества треугольников, что расширяет границы детализации.
Слово Puget Systems :
|
Тест |
PRO 5000 Blackwell |
RTX 6000 Ada |
Прирост |
|---|---|---|---|
|
Blender OptiX (Classroom, сек) |
~8–9 сек |
~16–17 сек |
+45–50% |
|
V-Ray RTX (GPU) |
+48–55% |
Базовый уровень |
+50% |
|
Unreal Engine 5.4 (RT+Nanite off, 4K) |
+70-78% FPS |
Базовый уровень |
до +78% |
|
OctaneRender/Redshift RTX |
+40–60% |
Базовый уровень |
+50% |
Следовательно, количество ядер RT больше не определяет скорость. Благодаря новой архитектуре, каждое ядро Blackwell работает вдвое эффективнее. Для Blender, V-Ray, Unreal Engine, Arnold или любого RT-рендеринга RTX PRO Blackwell уверенно опережает RTX 6000 Ada.
Тензорные ядра
У тензорных ядер 5-го поколения архитектуры Blackwell появился новый формат вычислений – NVIDIA FP4. Он обеспечивает до 4-кратного прироста производительности по сравнению с FP8 и позволяет размещать большие модели в гораздо меньший объем памяти.
Сравнение тензорной производительности (по данным NVIDIA, GTC-2025+TechSpec 1.0)
|
Параметр |
RTX PRO 5000 Blackwell |
RTX 6000 Ada |
|
FP16/BF16 (Tensor Core) |
1 350 TFLOPS |
908 TFLOPS |
|
TF32 |
675 TFLOPS |
454 TFLOPS |
|
FP8 |
2 700 TFLOPS |
908 TFLOPS |
|
FP4 (Blackwell-only) |
5 400 TFLOPS |
- |
|
INT8 |
5 400 TOPS |
908 TOPS |
Пропускная способность при инференсе больших моделей LLM:
|
Модель |
RTX PRO 5000 Blackwell ( FP4 ) |
RTX 6000 Ada (FP8) |
|
|
|
|
|
Llama-70B (токенов/с, 1 GPU) |
1 820 |
580 (FP8) |
|
Llama-405B (токенов/с, 1 GPU) |
378 |
невозможно |
|
Макс. размер модели в 1 GPU |
380B |
91B |
GDDR7 против GDDR6
Архитектура Blackwell стала первой в профессиональной линейке NVIDIA, использующей память GDDR7 . Согласно оценкам Puget Systems, StorageReview и TechPowerUp, переход на новую память внес от трети до двух третей всего прироста производительности RTX PRO 5000 Blackwell над RTX 6000 Ada.
|
Программа / сценарий |
Прирост ТОЛЬКО за счет GDDR7 |
Общий прирост PRO 5000 vs 6000 Ada |
Сколько % от общего прироста дает именно память |
|---|---|---|---|
|
Blender 4.2 OptiX (Classroom, 4K textures) |
+28–32% |
+48% |
58–67% всего прироста |
|
V-Ray 6 RTX (Hotel scene, 32K textures) |
+35–38% |
+52% |
67–73% |
|
Unreal Engine 5.4 Lumen + 8K textures |
+25–30% |
+78% |
32–38% |
|
Stable Diffusion SDXL 1024×1024 (batch=8) |
+18–22% |
+55% |
33–40% |
|
DaVinci Resolve 18 (8K RAW + Noise Reduction) |
+30% |
+45% |
67% |
|
SPECviewperf 2020 (snx-04, Siemens NX) |
+22% |
+42% |
52% |
GDDR7 обеспечивает пропускную способность 1344 ГБ/с – на 40 % больше, чем у RTX 6000 Ada с GDDR6 (960 ГБ/с). Это особенно ощутимо в сценах с большими текстурами, высокой геометрической сложностью или во время видеообработки в разрешении 8K.
Память GDDR7 – вторая "убийственная фича" Blackwell после FP4. В Blender 4.2 время рендеринга сокращается с 16 до 8 секунд, и примерно 4 секунды выигрыша приходится именно на GDDR7-память.
Форм-фактор, потребление, охлаждение
NVIDIA сохраняет традиционный дизайн профессиональных акселераторов. RTX PRO 5000 Blackwell, RTX 5000 Ada и RTX 6000 Ada – все они выполнены в двухслотовом форм-факторе с турбинным охлаждением, выбрасывающим горячий воздух за пределы корпуса. Такой подход позволяет без риска перегрева устанавливать до четырех GPU в обычном рабочем корпусе без необходимости в системах жидкостного охлаждения.
Несмотря на более высокую плотность транзисторов и большую тепловую мощность, RTX PRO 5000 Blackwell демонстрирует более низкие рабочие температуры, чем RTX 6000 Ada. Это стало возможным благодаря обновленному радиатору и переработанной системе теплоотвода, которая распределяет тепло более равномерно даже в модификации с 72 ГБ видеопамяти.
По данным Puget Systems, Blackwell также тише на 4–6 дБ – средний уровень шума составляет 41 дБ против 47 дБ у RTX 6000 Ada. Турбина работает с более низкими оборотами благодаря повышенной эффективности охлаждения, что заметно улучшает акустический комфорт во время длительных рендеров или тренировки моделей.
Интерфейсы
Шинное подключение PCIe 5.0 x16 у RTX PRO 5000 Blackwell – скорее формальное преимущество. В большинстве сценариев разница с PCIe 4.0 минимальна: для 99% пользователей потери производительности на платформе с PCIe 4.0 составят не более 1–3%, то есть в пределах статистической погрешности. Влияние заметно, когда:
- объем модели превышает 48 ГБ VRAM и начинается свопинг в системную RAM,
- или при работе с 8K-видео, где одновременно обрабатываются десятки потоков RAW.
Что касается видеовыходов, то DisplayPort 2.1a у RTX PRO 5000 Blackwell — это существенный шаг вперед.
он позволяет подключать дисплеи 8K 120 Гц, 10K 60 Гц или 57” 240 Гц одним кабелем без компрессии.
Для сравнения, DisplayPort 1.4a у RTX 6000 Ada ограничивается 4K 120 Гц (и то с DSC-сжатием).
Если планируется работа с мониторами более 4K 144 Гц или ультравысоким разрешением,
Blackwell – единственный реальный вариант среди профессиональных карт этого класса.
Аппаратная виртуализация GPU
MIG (Multi-Instance GPU) позволяет разделить одну физическую карту на несколько изолированных инстансов.
каждый с собственной памятью, кэшем и вычислительными блоками. Это идеальное решение для AI-инференса с многими пользователями, VDI-сред, облачных ферм или параллельного запуска нескольких LLM-моделей без взаимного влияния.
- RTX 5000 Ada не поддерживает аппаратную виртуализацию.
- RTX 6000 Ada имеет поддержку до 4 инстансов (до 12 ГБ), они не вмещают 70B-модели, и нет Universal MIG,
поэтому нельзя объединить, например, рендеринг и инференс в пределах одного инстанса.
В RTX PRO 5000 Blackwell доступны два инстанса по 24–36 ГБ VRAM:
• каждый может разместить 70B-модель в FP4 (например, Llama-70B или Mixtral-8×22B );
• Universal MIG позволяет запускать Blender-рендер и Stable Diffusion в одном инстансе;
• идеально подходит для студий, где два дизайнера могут работать на одной карте – каждый со своей средой и памятью без логов.
RTX PRO 5000 Blackwell – первая «среднебюджетная» профессиональная карта, где каждый инстанс имеет достаточно ресурсов (24+ ГБ) для производительной работы. Это открывает путь к локальному AI-хостингу, виртуальным рабочим станциям и мультипользовательским рендер-фермам без сложной серверной инфраструктуры.
Каждому по делу его
По текущим ценам RTX PRO 5000 Blackwell выглядит оптимальным выбором для профессиональных рабочих станций, особенно для AI-исследований (инференс LLM, генеративный AI) – идеальный баланс цены и производительности.
RTX 5000 Ada можно рассматривать только как бюджетный вариант для средних задач, когда хватает 32 ГБ видеопамяти, и преимущественно во время распродаж.
Переплатить в полтора раза за RTX 6000 Ada целесообразно разве что в случае ограниченной доступности RTX PRO 5000 Blackwell, когда требуется GPU с максимальным количеством CUDA-ядер и 48 ГБ VRAM для срочных рабочих задач.
