NVIDIA официально представила свои флагманские ИИ-ускорители Rubin, которые позиционируются как основной элемент ИИ-ЦОД следующего поколения. По заявлению компании, Rubin обеспечивает пятикратный прирост производительности по сравнению с Blackwell и задает новый технологический ориентир для масштабных ИИ-нагрузок.
GPU Rubin и CPU Vera. Источник: Источник: YouTube.
Nvidia Rubin
В семейство Rubin вошел ряд как базовых, как и комплексных решений, которые прошли валидацию на фабриках и в лабораториях NVIDIA. В основе лежит GPU Rubin, который состоит из двух вычислительных кристаллов и обеспечивает до 50 PFLOPS ИИ-производительности в инференсе в формате NVFP4 и до 35 PFLOPS при обучении в NVFP4, что обеспечивает 5 и 3,5-кратный прирост относительно предыдущего поколения Blackwell. Подсистема памяти на базе HBM4 достигает пропускной способности до 22 ТБ/с на чип, а межсоединение NVLink обеспечивает до 3,6 ТБ/с, что примерно вдвое выше показателей Blackwell.
Еще одним неотъемлемым компонентом экосистемы Rubin стал CPU Vera, основанный на Arm-архитектуре с ядрами Olympus, разработанными Nvidia. Чип Vera включает 88 вычислительных ядер и поддерживает 176 потоков за счет технологии Spatial Multi-Threading. Процессор использует когерентную память NVLink-C2C с пропускной способностью до 1,8 ТБ/с, поддерживает до 1,5 ТБ системной памяти и LPDDR5X с пропускной способностью 1,2 ТБ/с. В сравнении с Grace производительность задач обработки данных, сжатия и CI/CD увеличена примерно в два раза, при этом реализованы конфиденциальные вычисления на уровне стойки.
Центральный процессор Nvidia Vera. Источник: YouTube.
Nvidia Vera Rubin
Оба передовых компонента объединяются в новый суперчип Vera Rubin, который базируется на 2 GPU Rubbin и 1 CPU Vera.
ConnectX-9 обеспечивает до 1,6 ТБ/с сетевой пропускной способности и ориентирован на крупномасштабные ИИ-кластеры, а BlueField-4 представляет собой 800G DPU c 64 ядрами Grace, обеспечивающий в 2-раза большую скорость и в 6 раз большую вычислительную эффективность относительно BlueField-3.
Еще одно уникальное сетевое решение — чип Spectrum-X, который является первым в мире оптическим Ethernet-свитчем с поддержкой 512 портов и пропускной способностью в 200 Гбит/с.
Все это объединено в стойке NVIDIA Vera Rubin NVL72. По сравнению с Blackwell она демонстрирует кратный рост ключевых показателей: 5-кратное увеличение производительности инференса и 3.5-кратное ускорение обучения в формате NVFP4, рост объемов и пропускной способности HBM4 в 1,5 раз и LPDDR5X в 3 раза, а также 2-кратное расширение масштабируемой межсоединительной полосы пропускания. Дополнительно NVIDIA представила Spectrum-X Ethernet с ко-пакетированной оптикой, обеспечивающий коммутацию до 102,4 Тбит/с и высокую эффективность масштабирования за счет кремниевой фотоники.
Вычислительная стойка Nvidia Vera Rubin NVL72. Источник: YouTube.
Выводы
NVIDIA Rubin представляет собой не просто минорное обновление архитектуры Blackwell, а полноценный переход к совершенно новому классу ИИ-платформ с огромным приростом производительности. Это самый долгожданный релиз с момента релиза Blackwell, и он изменит всю индустрию искусственного интеллекта. Комбинация GPU Rubin с HBM4, процессора Vera на архитектуре Olympus, NVLink 6 и обновленной сетевой экосистемы позволяет добиться пятикратного роста производительности, и с этим end-to-end стеком придется считаться всем. Размещение платформы в стойках NVL72 и комплексах DGX SuperPOD делает Rubin ключевым элементом будущих центров обработки данных, ориентированных на обучение и инференс ИИ в экстремальных масштабах.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.