Top.Mail.Ru
INTELLECT-3: новая 106b-модель для ИИ-агентов нового поколения | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Из-за нестабильности цен RAM фактическая стоимость может отличаться. Цена подтверждается после оформления заказа, работаем над обновлением цен!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

INTELLECT-3: новая 106b-модель для ИИ-агентов нового поколения

~ 2 мин
103
Простой
Новости
INTELLECT-3: новая 106b-модель для ИИ-агентов нового поколения

Введение

Компания Prime Intellect представила INTELLECT-3 — большую модель на архитектуре Mixture-of-Experts с 106 млрд параметров, созданную на базе GLM-4.5 Air Base и ориентированную для выполнения сложных, логических задач с рассуждением, программирование и многоэтапные действия. Разработчики позиционируют ее как передовой инструмент для создания следующего поколения для агентных систем.

Подробнее о INTELLECT-3

Разработка INTELLECT-3 состояла из двух этапов: изначально модель прошла SFT-обучение, после чего была дообучена с помощью масштабного RL-пайплайна, где асинхронные методы оптимизации стали центральным элементом обучения, а не экспериментальной надстройкой. Для тренировки использовался массивный кластер из 512 ИИ-ускорителей H200, на котором модель обучалась около двух месяцев.

Проект был реализован полностью на собственном технологическом стеке компании Prime Intellect: система PRIME-RL обеспечивала обучение с подкреплением, модуль верификатор занимался проверкой корректности решений, а система Environments Hub предоставляла масштабируемые среды для обучения выполнения агентных задач и операций размышления. Важная деталь: весь набор инструментов находится в открытом доступе, включая sandbox-инфраструктуру, что делает INTELLECT-3 одними из самых прозрачных проектов среди моделей свыше 100 миллиардов параметров.

По результатам тестов модель демонстрирует выдающуюся производительность в направлениях, где привычные LLM часто теряют точность: многоэтапная математика, продвинутая генерация кода и задачи, требующие длительного удержания состояния окружения. Модель сумела обойти такие топовые открытые нейросети, как DeepSeek R1, GLM-4.5 и GLM-4.5-Air. Разработчики подчеркивают, что INTELLECT-3 создавалась не как “модель для чата”, а как основа для высокоуровневых агентных систем и автономных рассуждающих сред, поэтому в языковых операциях она не отличается высокой эффективностью. Открытому сообществу доступны технический отчёт, инструменты RL-стека, а также репозиторий модели на Hugging Face.

Производительность ИИ-модели INTELLECT-3
Производительность ИИ-модели INTELLECT-3. Источник: Hugging Face.

Выводы

INTELLECT-3 — это крайне интересный представитель масштабных ИИ-моделей open-source сообщества. INTELLECT-3 способна усилить конкуренцию среди моделей, ориентированных на сложные рассуждения и агентские операции, а также эта передовая нейросеть открывает исследователям доступ к реальному, полнофункциональному программному стеку для работы с продвинутым RL и верификацией. Такая открытость может ускорить развитие всего направления размышляющих ИИ и дать толчок новой волне исследований в агентных системах.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)