На конференции GTC 2025 помимо новейших графических чипов Blackwell Ultra и Rubin, Дженсен Хуанг также представил новое программное обеспечение для разработчиков искусственного интеллекта — Nvidia Dynamo. По заявлениям компании, при выводе DeepSeek R1 через Dynamo в системе с ускорителями GB200, количество генерируемых токенов увеличится в колоссальные 30 раз.
Особенности Nvidia Dynamo
Nvidia Dynamo представляет собой программную библиотеку с открытым исходным кодом, с помощью которой можно эффективно увеличивать производительность и упростить масштабирование передовых рассуждающих LLM, при этом сокращая затраты на генерацию токенов. Новое ПО работает следующим образом — Dynamo ускоряет передачу данных между графическими процессорами в многоузловых системах и разделяет фазы предварительного заполнения и декодирования вывода. Это позволяет оптимизировать обе фазы, что обеспечивает максимально эффективное распределение вычислительных ресурсов GPU. Помимо этого, Nvidia Dynamo предлагает следующие возможности:
Динамическое планирование работы графического процессора, оптимизирующее производительность ИИ до 2 раз;
Маршрутизация запросов LLM, которая интеллектуально направляет запросы для минимизации избыточных вычислений в кэше KV, улучшая качество первого токена на 40%;
Ускоренная передача данных с помощью NIXL (NVIDIA Inference tranXfer Library);
Разгрузка кэша KV, которая использует несколько иерархий памяти для повышения производительности системы, ускоряя генерацию первого токена в 3 раза.
Компания Nvidia также рассказала, какие системные требования необходимо соблюдать для обеспечения наилучшей эффективности работы Dynamo:
Как заявил Дженсен Хуанг, Nvidia Dynamo — это не просто полезное ПО для независимых ИИ-разработчиков, а решение, необходимое для так называемых AI-фабрик, представляющих собой новый этап развития дата-центров для разработки передовых ИИ. Более того, Nvidia Dynamo способна решить ряд фундаментальных проблем, с которыми разработчики сталкиваются при обучении и развертывании своих LLM. Ввиду этого, создание такого эффективного инструмента вполне может дать индустрии искусственного интеллекта еще один толчок, что приведет к увеличению ИИ-тренда и появлению более совершенных языковых моделей.
Nvidia снова меняет правила игры! Dynamo выглядит как настоящий «турбо-режим» для LLM — 30-кратный прирост токенов на GB200 звучит фантастически, даже для Хуанга. Особенно впечатляет акцент на оптимизацию передачи данных между GPU: похоже, они наконец-то атаковали главную узкую горловину в кластерных вычислениях — латентность межчиповой коммуникации. Открытый исходный код здесь ключевой момент — это не просто маркетинг, а прямой ход для захвата экосистемы: если Dynamo станет стандартом де-факто для оптимизации LLM (как CUDA в своё время), то Nvidia фактически возьмёт под контроль весь пайплайн ИИ-разработки, от железа до софта.
Но есть нюансы. Требование Ubuntu 24.04 и строго Nvidia GPU создаёт эффект «золотой клетки» — удобно, но привязывает к их стеку. А заявления про 3-кратное ускорение первого токена за счёт KV-кэша хочется проверить на практике: иногда в реальных сценариях с разнородными запросами такие оптимизации дают профит только на синтетических тестах.
Такие дела
Serverflow
Да, с убунту интересная мысль, но нвидиа же все таки не НКО, у них основная цель прибыль, отсюда и... такие "костыли".
Скидка 3 000 ₽ или бесплатная доставка — уже сейчас 🔥
Мы ценим вашу обратную связь. После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.