Nvidia представила Vera Rubin на GTC 2026: новое поколение самых производительных ИИ-решений

17.03.2026

~ 2 мин

Простой

Новости

Введение

На конференции GTC 2026 CEO компании NVIDIA Дженсен Хуанг официально анонсировала новое поколение самых высокопроизводительных ИИ-решений — Vera Rubin. В центре экосистемы стоят графические ускорители Rubin, центральные процессоры Vera, новейшие ИИ-чипы LPU от недавно приобретенного стартапа Groq, которые в совокупности обеспечивают невероятную ИИ-производительность для инференса и обучения моделей искусственного интеллекта нового поколения, удовлетворяя потребности мощнейших ИИ-ЦОД на годы вперед.

Подробнее о Nvidia Vera Rubin

Экосистема Vera Rubin состоит из семи чипов, каждый из которых спроектирован для конкретных задач в составе единой экосистемы. В нее входят: графический процессор Rubin, центральный процессор Vera, сетевой адаптер ConnectX-9 (CX9), DPU BlueField-4, коммутатор NVLink 6, оптический коммутатор Spectrum-X CPO и LPU Groq 3 для ИИ-инференса. GPU Rubin выполнен по техпроцессу TSMC 3 и проектируется с чиплетной архитектурой, которая вкдючает два массивных кристалла и 8 блоков HBM4. Rubin оснащен 288 ГБ памяти HBM4 с общей пропускной способностью до 22 ТБ/с и вычислительной производительностью 50 PFLOPS в формате NVFP4.

Вычислительные ноды экосистемы Nvidia Vera Rubin. Источник: YouTube.

Новый 88-ядерный CPU Vera на базе кастомных Arm-ядер Olympus использует память LPDDR5X до 1,5 ТБ, что обеспечивает высочайшую производительность на ватт, чрезвычайно высокую производительность однопоточных ядер и высокую скорость обработки данных. NVIDIA не просто интегрирует процессоры Vera в платформу Vera Rubin, но и будет выпускать их отдельно в виде стойки на 256 процессоров с пропускной способностью 300 ТБ/с по шине LPDDR5X. Все они будут соединены между собой с помощью системы ETL Spine и обеспечат в 6,5 раз большую пропускную способность по сравнению с решением предыдущего поколения.

88-ядерный центральный процессор Nvidia Vera. Источник: Nvidia.

Система NVLink 6 обеспечивает межсоединения с пропускной способностью до 260 ТБ/с в ИИ-стойках Vera Rubin NVL72, где объединены 72 GPU Rubin и 36 CPU Vera. Эта связка позволяет обучать MoE-модели с использованием в 4 раза меньшего числа GPU по сравнению с предыдущим поколением Blackwell. Каждый NVL72 обеспечивает в 10 раз более высокую производительность на ватт, производительность до 3,6 EFLOPS в формате NVFP4 при инференсе и 2,520 EFLOPS в обучении, объем памяти в 20,7 ТБ HBM4, пропускную способность до 1,6 ПБ/с и скорость межсоединений NVLink 6 в 260 ТБ/с. Стойки также будут поддерживать режимы вычислений FP8/FP6 (1,260 EFLOPS), FP16/BF16 (288 PFLOPS), FP32 (9,360 TFLOPS) и FP64 (2,400 TFLOPS). Стойки с Rubin и Vera проектировались с учетом жидкостного охлаждения горячей водой (до 45 °C), что сокращает время развертывания с двух дней до двух часов и снижает энергопотребление. Вся инфраструктура Vera Rubin рассчитана на масштабирование до сотен тысяч ускорителей и полностью унифицирована на уровне программного стека NVIDIA AI Enterprise.

Экосистема чипов Nvidia Vera Rubin. Источник: YouTube.

Для логического вывода в состав экосистемы Vera Rubin интегрированы вычислительные модули Groq 3 LPX, состоящий из 8 графических процессоров GROQ под кодовым названием LP30. Каждый графический процессор Groq 3 оснащен 500 МБ SRAM, имеет пропускную способность 150 ТБ/с и производительность 1,2 PFLOPS в режиме FP8. Groq 3 LPX будут выпускаться в виде отдельных стоек с 256 процессорами Groq 3 LPU, соединенных высокоскоростным межсоединением LPU C2C с пропускной способностью 640 ТБ/с. Суммарная производительность стойки достигает 315 PFLOPS в FP8 и объемом встроенной SRAM-памяти в 128 ГБ. Связка NVL72 и LPX способна обслуживать модели с триллионами параметров и контекстом в миллион токенов со скоростью тысячи токенов в секунду на пользователя.

Вычислительная нода Groq 3 LPX и ее характеристики. Источник: YouTube.

Помимо вычислительных модулей, представлены стойки хранения данных BlueField-4 STX, а также коммутаторы Spectrum-X CPO — первые в мире коммутаторы с интегрированной оптикой, изготовленные по технологии Cu-Litho на мощностях TSMC. Еще одни передовые решения под названием Compute Tray Vera представляют из себя отдельные высокопроизводительные ноды на базе процессоров Vera и коммутаторов ConnectX-9, разгружающие основные вычислительные ноды от задач обработки трафика.

Выводы

Анонс платформы Vera Rubin знаменует новый этап в развитии ИИ-инфраструктуры NVIDIA. Rubin с 288 ГБ HBM4 и 50 PFLOPS на GPU задает новый стандарт плотности вычислений, а CPU Vera с памятью LPDDR5X открывает отдельное направление развития экосистемы Nvidia. С приходом экосистемы Vera Rubin NVIDIA не просто обновляет линейку, а перестраивает всю логику построения дата-центров, делая их легко масштабируемыми, энергоэффективными и готовыми к моделям следующего поколения. Платформа уже сегодня доступна для партнеров компании, а поставки начнутся во втором полугодии 2026 года.

Автор:

Serverflow