Top.Mail.Ru
Nvidia OpenReasoning-Nemotron — новые ИИ на базе DeepSeek и Qwen | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Nvidia OpenReasoning-Nemotron — новые ИИ на базе DeepSeek и Qwen

~ 2 мин
39
Простой
Новости
Nvidia OpenReasoning-Nemotron — новые ИИ на базе DeepSeek и Qwen

Введение

Компания NVIDIA анонсировала OpenReasoning-Nemotron — набор из четырех оптимизированных моделей с открытым исходным кодом объемом в 1,5, 7, 14 и 32 миллиардов параметров, созданных на базе Qwen 2,5 с применением дистилляции из модели DeepSeek R1 671b.

Подробнее о Nvidia OpenReasoning-Nemotron

Благодаря использованию более крупной, учительской модели DeepSeek R1 671b, Nvidia удалось добиться значительно сжать объем новых языковых моделей на базе Qwen‑2.5, при этом сохранив функцию рассуждения и позволив развертывать их на пользовательских системах, вроде игровых ПК среднего уровня. Помимо этого, главным нововведением стал упор на использование качественных синтетических данных, а не улучшение алгоритмов архитектур ИИ. . Используя конвейер NeMo Skills, NVIDIA сгенерировала пять миллионов решений по математике, естествознанию и программированию, после чего доработала их исключительно методом обучения с учителем. Модель с 32 миллиардов параметров достигла 89,2 балла на AIME24 и 73,8 балла на февральском HMMT, тогда как даже 1,5-миллиардный вариант показал не менее значимые результаты — 55,5 и 31,5 балла. Nvidia позиционирует новые модели как мощный исследовательский инструмент для энтузиастов и ИИ-экспериментов. 

Производительность OpenReasoning-Nemotron
Показатели производительности моделей OpenReasoning-Nemotron. Источник: HuggingFace.

Все четыре версии моделей набора OpenReasoning-Nemotron доступны для загрузки на Hugging Face, также предоставляя сообществу информацию для изучения обучения с подкреплением и предметной адаптации. Режим GenSelect (требующий многопроходной обработки вопросов) запускает параллельные генерации для выбора оптимальных ответов нейросетей, что позволяет 32-миллиардной модели достигать производительности, сопоставимой или превосходящей даже нейросети o3‑high от OpenAI в математических и программистских тестах. Поскольку обучение велось только через контролируемую тонкую настройку без RLHF, сообщество получает чистые отправные точки для проведения экспериментов с обучением с подкреплением. Энтузиасты и геймеры могут локально запускать модели, приближенные к современным state-of-the-art решениям, при наличии мощного игрового GPU. 

Вывод

Несмотря на то, что Nvidia позиционирует модели OpenReasoning-Nemotron как исследовательские, можно с уверенностью сказать, что открытый исходный код и высокая производительность в программировании и математике сделают новые нейросети востребованными и в коммерческой среде. Кроме того, Nvidia осознает, что тренд на локальное развертывание искусственного интеллекта будет лишь расти, поэтому компания активно заполняет рынок собственными, открытыми платформами, вытесняя популярных облачных ИИ-провайдеров, таких как OpenAI и Google.

Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)