Компания Nvidia представила новую открытую ИИ-модель Nemotron-Cascade 2 на базе архитектуры MoE с 30 миллиардами общих и 3 миллиардами активных параметров, а также контекстным окном в 256 тысяч токенов. Модель продвигается как решение класса “плотного ИИ”, что объясняется высочайшими результатами в ключевых ИИ-бенчмарках при сравнительно небольшом объеме параметров — Nemotron-Cascade 2 стала второй открытой LLM, завоевавшей золотую медаль Международной математической олимпиады (IMO) 2025 года, а также получила золото на Международной олимпиаде по информатике (IOI) и в финале ICPC. Эффективность Nemotron-Cascade 2 объясняется уникальной методикой обучения, поддержкой глубокого рассуждения и специализированных навыков.
Подробнее о Nvidia Nemotron-Cascade 2
Модель Nemotron-Cascade 2 представляет из себя дообученную версию Nemotron-3-Nano-30B-A3B-Base, однако дообучение выполнялось методом Cascade Reinforcement Learning (Cascade RL). В отличие от классического RL, где данные из разных областей смешиваются в одну кучу, Cascade RL разделяет процесс обучения на последовательные этапы, на каждом из которых модель получает знания от одной области к другой, у каждой из которых своя схема верификаторов и вознаграждений — это увеличивает эффективность работы нейросети и, что самое важное, предотвращает катастрофическое забывание, свойственное традиционным ИИ-трансформерам с длинным контекстным окном. В конце обучения знания дистиллируются по новому методу MOPD (Multi-Domain On-Policy Distillation). Схема MOPD использует промежуточные учительские модели, которые позволяют выполнять плотную дистилляцию знаний. В результате Cascade RL, модель Nemotron-Cascade 2 достигает высочайшей эффективности в ключевых задачах, таких как математика, программирование, следование инструкциям, при этом все данные умещаются в 30 миллиардах параметров. Помимо основного обучения, модель Nemotron-Cascade 2 также была оптимизирована с помощью метода SFT, для которого использовались тщательно подобранные наборы данных из различных областей, упакованные в последовательности до 256K токенов.
Пайплайн обучения Nvidia Nemotron-Cascade 2. Источник: .
Все эти технологии позволили Nvidia Nemotron-Cascade 2 завоевать превосходство над Qwen3.5-35B-A3B и Nemotron-3-Super-120B-A12B сразу в трех категориях:
Математические рассуждения: AIME 2025 — 92,4 против 91,9; HMMT Feb25 — 94,6 против 89,0.
Программирование: LiveCodeBench v6 — 87,2 против 74,6; IOI 2025 — 439,28 против 348,6+.
Следование инструкциям: ArenaHard v2 — 83,5 против 65,4+; IFBench — 82,9 против 70,2.
Модель Nemotron-Cascade 2 поддерживает два режима работы: с размышлением для сложных логических задач и без размышления для максимальной скорости вывода. Для агентных задач модель использует структурированный протокол вызова инструментов внутри системного промпта. Доступные инструменты перечисляются в тегах <tools>, а вызовы оборачиваются в теги $_$. Веса модели уже лежат на Hugging Face, а для ее развертывания потребуется минимум 24 ГБ VRAM.
Результаты тестирования Nvidia Nemotron-Cascade 2. Источник: .
Выводы
Nemotron-Cascade 2 доказывает, что глубокие математические рассуждения и агентные возможности не требуют сотен миллиардов параметров. Всего 30 миллиардов общих и 3 миллиарда активных параметров вполне достаточно, чтобы завоевывать золото IMO, IOI и ICPC. И это достигается только максимально точным, качественным пост-тренингом: каскадное RL предотвращает потерю навыков, MOPD обеспечивает эффективную дистилляцию, а SFT доводит все до идеала. Результат — одна из лучших открытых моделей в своем классе для программирования, математики, следования инструкциям и сложных рассуждений при низкой вычислительной стоимости инференса.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.