Новая база GPU-серверов
Современные графические процессоры (GPU) эффективнее типовых центральных процессоров (CPU) в параллельных вычислениях. Пока «премьер-лига» примеряется к готовым GPU-серверам NVIDIA DGX A100 производительностью 5 петафлопс и стоимостью $200K, рядовые пользователи интересуются более демократичными платформами под размещение нескольких GPU-ускорителей. Из-за многообразия моделей графических вычислений растет спрос на гибридные системы, состоящие из связок GPU с многоядерными CPU.
Процессоры AMD EPYC как нельзя лучше подходят в качестве основы GPU-серверов – это единственные x86-совместимые CPU, у которых до 64 ядер и 128 линий PCIe Gen4. У Intel Xeon SP до 28 ядер и 48 линий PCIe Gen3. NVIDIA переводит свои серверы на процессоры AMD EPYC. Мы тоже.
ASUS ESC4000A-E10 – образец универсальной GPU-платформы на одном AMD EPYC. Присмотримся поближе.
Такой сервер обслуживает один процессор AMD EPYC 7002, в диапазоне от 8 до 64 ядер, включая высокочастотные – как EPYC 7F52 (16 cores @3.5GHz). В сервере 11 слотов PCIe Gen 4 для установки плат расширения: графики, дисковых и сетевых контроллеров. Можно поставить четыре GPU-ускорителя двойной толщины.
Поддерживается установка Ethernet-адаптера стандарта OCP 3.0 с пропускной способностью до 200 Гбит/с., до восьми 3,5- или 2,5-дюймовых дисков с поддержкой «горячей» замены, причем четыре устройства могут быть NVMe-накопителями.
Блок-схема платформы:
Платформа поддерживает новейшие PCIe-ускорители NVIDIA A100 с микроархитектурой NVIDIA Ampere, платы Tesla T4 и профессиональные видеокарты Quadro. Какие именно ставить, определяет задача – как в этом сравнительном анализе. Благо, разработчики обычно знают, каких и сколько им надо GPU-акселераторов.
Наше дело – помочь им с основой.