Top.Mail.Ru
NVIDIA DGX SuperPOD: основа вычислений эпохи Rubin | Новости ServerFlow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Nvidia DGX SuperPOD: основа вычислений эпохи Rubin

~ 2 мин
179
Простой
Новости
Nvidia DGX SuperPOD: основа вычислений эпохи Rubin

Введение

В ходе анонса решений экосистемы Rubin компания NVIDIA также рассказала о вычислительных системах DGX SuperPOD, которые представляют из себя крупномасштабные кластеры для с возможностью эффективного масштабирования для ИИ-ЦОД. Решения предназначены для инференса и обучения моделей искусственного интеллекта с экстремально большим контекстом, выполнения высокопроизводительных вычислений и других наиболее требовательных задач, снимая с пользователей все сложности, связанные с интеграцией инфраструктуры и позволяя сосредоточиться на прикладных операциях.

Подробнее о Nvidia DGX SuperPOD

В системах DGX Rubin платформа опирается на ряд фундаментальных технологических достижений. NVLink 6 обеспечивает до 3,6 ТБ/с на графический процессор и до 260 ТБ/с на стойку Vera Rubin NVL72, что критично для масштабных MoE-нагрузок. Процессор Vera с 88 специализированными ядрами Olympus и поддержкой Armv9.2 использует сверхбыстрое соединение NVLink-C2C. Графический процессор Rubin достигает 50 PFLOPS в формате NVFP4 для инференса, а механизм Transformer третьего поколения дополнен аппаратным ускорением сжатия. Дополняют платформу технологии конфиденциальных вычислений на уровне стойки и RAS-движок второго поколения, обеспечивающий мониторинг, отказоустойчивость и ускоренное обслуживание без простоев. В совокупности эти решения, по оценке NVIDIA, позволяют сократить стоимость токенов вывода до десяти раз по сравнению с предыдущим поколением DGX SuperPOD на базе Blackwell.

Развертывание DGX SuperPOD на базе Rubin предполагает интеграцию стоек DGX Vera Rubin NVL72 или DGX Rubin NVL8, сетевых адаптеров ConnectX-9, DPU BlueField-4, платформы хранения NVIDIA Inference Context Memory, а также сетей NVIDIA Quantum-X800 InfiniBand и Spectrum-X Ethernet под управлением программного комплекса NVIDIA Mission Control.

Конфигурация DGX SuperPOD с системами DGX Vera Rubin NVL72 объединяет восемь стоек, в сумме обеспечивая 576 GPU Rubin, до 28,8 EFLOPS вычислительной мощности в формате FP4 и порядка 600 ТБ памяти. Каждая стойка функционирует как единое когерентное пространство вычислений и памяти благодаря NVLink с совокупной пропускной способностью 260 ТБ/с, что устраняет необходимость в разделении моделей. Альтернативный вариант DGX SuperPOD на базе DGX Rubin NVL8 включает 64 стойки с 512 GPU Rubin и ориентирован на более гибкий переход на новую архитектуру, включая использование процессоров x86 и жидкостного охлаждения. Каждая система DGX SuperPOD NVL8 обеспечивает более чем 5-кратный прирост производительности NVFP4 по сравнению с решениями Blackwell.

Выводы

DGX SuperPOD в сочетании с платформой NVIDIA Rubin формирует основу для нового поколения фабрик искусственного интеллекта, которые способны к наиболее эффективному масштабированию, высочайшей ИИ-эффективности и экономичности в долгосрочной перспективе. Интеграция вычислений, сетей и программного обеспечения позволяет преодолеть существующие ограничения ЦОД и подготовить инфраструктуру к работе с ИИ-моделями будущего. Системы NVIDIA DGX SuperPOD на базе DGX Vera Rubin NVL72 и DGX Rubin NVL8 ожидаются к поставке во второй половине 2026 года.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)