Чотири GPU в одній робочій станції

29.11.2022 | Станції

 

Робочі станції з кількома GPU (multi-GPU) використовують у машинному навчанні, комп'ютерній графіці, математичних розрахунках – задачах, де продуктивність масштабується з додаванням акселераторів. Зазвичай йдеться про карти NVIDIA. Облаштування рядових станцій з 1-2 GPU не викликає проблем, але щойно мова заходить про 3-4 акселератори, типовими рішеннями не обійтися, стукають копитами "чотири вершники Апокаліпсису": конструктив, живлення, охолодження, шум.

Куди поставити чотири GPU

Все починається з вибору базової платформи та корпусу. Чотири акселератори можна розмістити на одній материнській платі тільки в тому випадку, коли GPU не товщі за два слоти PCIe і охолоджуються подовжньо, турбінами. Так влаштовані карти професійної лінійки NVIDIA A6000/A5500/A5000/A4500/A4000. Деякі виробники робили в такому ж дизайні лімітовані версії Turbo карт RTX 3000 (і, можливо, повторять досліди з RTX 4000).

 

 

У материнській платі має бути достатньо слотів x16 PCIe. Під установку чотирьох GPU подвійної товщини підходять, наприклад, такі:

На перших двох слоти x16 PCIe 3.0, на третій – x16 PCIe 4.0. Взагалі кажучи, два процесори на столі розробника сьогодні втратили актуальність – робочі станції на AMD Threadripper PRO позбавляють сенсу рішення 2 x Intel Xeon – продуктивністю та ціною реалізації.

Великі фізичні габарити материнських плат та GPU, вимоги щодо відведення тепла та рівня шуму впливають на вибір корпусу. Зручний Fractal Design Define 7 XL.

Чотири GPU в одній системі – не межа. Так, Puget Systems в дослідних цілях розгорнув тестовий стенд на сім акселераторів RTX 4090. На робочий стіл подібну конструкцію не поставиш, для такого є промислові рішення стійкового монтажу .

Живлення

Тепловий пакет (TDP) акселераторів покоління NVIDIA RTX 3000 - 300 Вт і вище. У RTX 4000 - 450 Вт і вище. З дослідів Puget Systems випливає, що під чотири GPU потрібне джерело потужності на 1800, а краще 2000 Вт.

Двокіловатників на ринку небагато: EVGA SuperNOVA 2000 G1+, FSP Cannon 2000W, Cooler Master M2000 Platinum.

Енергоспоживанням відеокарт можна керувати за допомогою інструментарію NVIDIA System Management Interface (nvidia-smi) з обмеження потужності. Простою командою

sudo nvidia-smi --power-limit=280

TDP RTX3090 знижується з 350ВТ до 280Вт. Як показують тести , гранична потужність GPU може бути знижена на 10-20% з незначним впливом на загальну продуктивність обчислень у системах з кількома GPU. Зате система стане стабільнішою, знизиться шум, схуднуть рахунки за електроенергію.

Джерело: Puget Systems

Охолодження

Сучасні відеокарти оснащені потужними радіаторами, тепловими трубками, вентиляторами в габаритних кожухах. У стандартних ПК картки охолоджуються низхідним потоком на вiдкритому повітрі. Два-три вентилятори всмоктують повітря зсередини корпусу і проштовхують через радіатор. Охолоджувачі відкриті з боків та ззаду, дозволяючи повітрю проходити у всіх напрямках через вентиляційні отвори. Такі карти займають три-чотири слоти і досить тихі.

У системах з кількома GPU місця бракує. Там використовують карти із вентиляторами нагнітального типу (турбінами). Повітря проштовхується через плату до задньої частини відеокарти, де через вентиляційні грати викидається назовні корпусу станції. При такому тепловідводі кожен GPU охолоджується автономно, не нагріваючи один одного і CPU - він і так гарячий. Турбіни працюють на високій швидкості, голосно.

Джерело: CGDirector

Зустрічаються карти з водяним охолодженням та карти з випарною камерою, дорогі та незграбні. Все ж таки мова про типові рішення multi-GPU.

Шум

На жаль, акселератори з турбонаддувом гучнішi за аналоги для ПК. Це плата за можливість масштабувати продуктивність додаванням GPU. Геймери порівнюють їхній шумовий профіль зі звуком реактивного двигуна перед зльотом. Але й промисловий цех не лікарня.

Управління споживанням, описане вище, знижує шум, при несуттєвій втраті продуктивності. Завжди варто підбирати корпус з акустичним захистом і малошумлячими вентиляторами, кулер CPU та блок живлення тихіше.

Робочі станції з кількома GPU не купують для гри. Хазяїн вільний сам порівнювати передбачувану вигоду з витратами.