Компания NVIDIA анонсировала OpenReasoning-Nemotron — набор из четырех оптимизированных моделей с открытым исходным кодом объемом в 1,5, 7, 14 и 32 миллиардов параметров, созданных на базе Qwen 2,5 с применением дистилляции из модели DeepSeek R1 671b.
Подробнее о Nvidia OpenReasoning-Nemotron
Благодаря использованию более крупной, учительской модели DeepSeek R1 671b, Nvidia удалось добиться значительно сжать объем новых языковых моделей на базе Qwen‑2.5, при этом сохранив функцию рассуждения и позволив развертывать их на пользовательских системах, вроде игровых ПК среднего уровня. Помимо этого, главным нововведением стал упор на использование качественных синтетических данных, а не улучшение алгоритмов архитектур ИИ. . Используя конвейер NeMo Skills, NVIDIA сгенерировала пять миллионов решений по математике, естествознанию и программированию, после чего доработала их исключительно методом обучения с учителем. Модель с 32 миллиардов параметров достигла 89,2 балла на AIME24 и 73,8 балла на февральском HMMT, тогда как даже 1,5-миллиардный вариант показал не менее значимые результаты — 55,5 и 31,5 балла. Nvidia позиционирует новые модели как мощный исследовательский инструмент для энтузиастов и ИИ-экспериментов.
Показатели производительности моделей OpenReasoning-Nemotron. Источник: HuggingFace.
Все четыре версии моделей набора OpenReasoning-Nemotron доступны для загрузки на Hugging Face, также предоставляя сообществу информацию для изучения обучения с подкреплением и предметной адаптации. Режим GenSelect (требующий многопроходной обработки вопросов) запускает параллельные генерации для выбора оптимальных ответов нейросетей, что позволяет 32-миллиардной модели достигать производительности, сопоставимой или превосходящей даже нейросети o3‑high от OpenAI в математических и программистских тестах. Поскольку обучение велось только через контролируемую тонкую настройку без RLHF, сообщество получает чистые отправные точки для проведения экспериментов с обучением с подкреплением. Энтузиасты и геймеры могут локально запускать модели, приближенные к современным state-of-the-art решениям, при наличии мощного игрового GPU.
Вывод
Несмотря на то, что Nvidia позиционирует модели OpenReasoning-Nemotron как исследовательские, можно с уверенностью сказать, что открытый исходный код и высокая производительность в программировании и математике сделают новые нейросети востребованными и в коммерческой среде. Кроме того, Nvidia осознает, что тренд на локальное развертывание искусственного интеллекта будет лишь расти, поэтому компания активно заполняет рынок собственными, открытыми платформами, вытесняя популярных облачных ИИ-провайдеров, таких как OpenAI и Google.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.