Компания NVIDIA анонсировала OpenReasoning-Nemotron — набор из четырех оптимизированных моделей с открытым исходным кодом объемом в 1,5, 7, 14 и 32 миллиардов параметров, созданных на базе Qwen 2,5 с применением дистилляции из модели DeepSeek R1 671b.
Подробнее о Nvidia OpenReasoning-Nemotron
Благодаря использованию более крупной, учительской модели DeepSeek R1 671b, Nvidia удалось добиться значительно сжать объем новых языковых моделей на базе Qwen‑2.5, при этом сохранив функцию рассуждения и позволив развертывать их на пользовательских системах, вроде игровых ПК среднего уровня. Помимо этого, главным нововведением стал упор на использование качественных синтетических данных, а не улучшение алгоритмов архитектур ИИ. . Используя конвейер NeMo Skills, NVIDIA сгенерировала пять миллионов решений по математике, естествознанию и программированию, после чего доработала их исключительно методом обучения с учителем. Модель с 32 миллиардов параметров достигла 89,2 балла на AIME24 и 73,8 балла на февральском HMMT, тогда как даже 1,5-миллиардный вариант показал не менее значимые результаты — 55,5 и 31,5 балла. Nvidia позиционирует новые модели как мощный исследовательский инструмент для энтузиастов и ИИ-экспериментов.
Показатели производительности моделей OpenReasoning-Nemotron. Источник: .
Все четыре версии моделей набора OpenReasoning-Nemotron доступны для загрузки на Hugging Face, также предоставляя сообществу информацию для изучения обучения с подкреплением и предметной адаптации. Режим GenSelect (требующий многопроходной обработки вопросов) запускает параллельные генерации для выбора оптимальных ответов нейросетей, что позволяет 32-миллиардной модели достигать производительности, сопоставимой или превосходящей даже нейросети o3‑high от OpenAI в математических и программистских тестах. Поскольку обучение велось только через контролируемую тонкую настройку без RLHF, сообщество получает чистые отправные точки для проведения экспериментов с обучением с подкреплением. Энтузиасты и геймеры могут локально запускать модели, приближенные к современным state-of-the-art решениям, при наличии мощного игрового GPU.
Вывод
Несмотря на то, что Nvidia позиционирует модели OpenReasoning-Nemotron как исследовательские, можно с уверенностью сказать, что открытый исходный код и высокая производительность в программировании и математике сделают новые нейросети востребованными и в коммерческой среде. Кроме того, Nvidia осознает, что тренд на локальное развертывание искусственного интеллекта будет лишь расти, поэтому компания активно заполняет рынок собственными, открытыми платформами, вытесняя популярных облачных ИИ-провайдеров, таких как OpenAI и Google.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.