INTELLECT-3: новая 106b-модель для ИИ-агентов нового поколения

29.11.2025

~ 2 мин

317

Простой

Новости

Введение

Компания Prime Intellect представила INTELLECT-3 — большую модель на архитектуре Mixture-of-Experts с 106 млрд параметров, созданную на базе GLM-4.5 Air Base и ориентированную для выполнения сложных, логических задач с рассуждением, программирование и многоэтапные действия. Разработчики позиционируют ее как передовой инструмент для создания следующего поколения для агентных систем.

Подробнее о INTELLECT-3

Разработка INTELLECT-3 состояла из двух этапов: изначально модель прошла SFT-обучение, после чего была дообучена с помощью масштабного RL-пайплайна, где асинхронные методы оптимизации стали центральным элементом обучения, а не экспериментальной надстройкой. Для тренировки использовался массивный кластер из 512 ИИ-ускорителей H200, на котором модель обучалась около двух месяцев.

Проект был реализован полностью на собственном технологическом стеке компании Prime Intellect: система PRIME-RL обеспечивала обучение с подкреплением, модуль верификатор занимался проверкой корректности решений, а система Environments Hub предоставляла масштабируемые среды для обучения выполнения агентных задач и операций размышления. Важная деталь: весь набор инструментов находится в открытом доступе, включая sandbox-инфраструктуру, что делает INTELLECT-3 одними из самых прозрачных проектов среди моделей свыше 100 миллиардов параметров.

По результатам тестов модель демонстрирует выдающуюся производительность в направлениях, где привычные LLM часто теряют точность: многоэтапная математика, продвинутая генерация кода и задачи, требующие длительного удержания состояния окружения. Модель сумела обойти такие топовые открытые нейросети, как DeepSeek R1, GLM-4.5 и GLM-4.5-Air. Разработчики подчеркивают, что INTELLECT-3 создавалась не как “модель для чата”, а как основа для высокоуровневых агентных систем и автономных рассуждающих сред, поэтому в языковых операциях она не отличается высокой эффективностью. Открытому сообществу доступны технический отчёт, инструменты RL-стека, а также репозиторий модели на Hugging Face.

Производительность ИИ-модели INTELLECT-3. Источник: Hugging Face.

Выводы

INTELLECT-3 — это крайне интересный представитель масштабных ИИ-моделей open-source сообщества. INTELLECT-3 способна усилить конкуренцию среди моделей, ориентированных на сложные рассуждения и агентские операции, а также эта передовая нейросеть открывает исследователям доступ к реальному, полнофункциональному программному стеку для работы с продвинутым RL и верификацией. Такая открытость может ускорить развитие всего направления размышляющих ИИ и дать толчок новой волне исследований в агентных системах.

Автор:

Serverflow