Компания Prime Intellect представила INTELLECT-3 — большую модель на архитектуре Mixture-of-Experts с 106 млрд параметров, созданную на базе GLM-4.5 Air Base и ориентированную для выполнения сложных, логических задач с рассуждением, программирование и многоэтапные действия. Разработчики позиционируют ее как передовой инструмент для создания следующего поколения для агентных систем.
Подробнее о INTELLECT-3
Разработка INTELLECT-3 состояла из двух этапов: изначально модель прошла SFT-обучение, после чего была дообучена с помощью масштабного RL-пайплайна, где асинхронные методы оптимизации стали центральным элементом обучения, а не экспериментальной надстройкой. Для тренировки использовался массивный кластер из 512 ИИ-ускорителей H200, на котором модель обучалась около двух месяцев.
Проект был реализован полностью на собственном технологическом стеке компании Prime Intellect: система PRIME-RL обеспечивала обучение с подкреплением, модуль верификатор занимался проверкой корректности решений, а система Environments Hub предоставляла масштабируемые среды для обучения выполнения агентных задач и операций размышления. Важная деталь: весь набор инструментов находится в открытом доступе, включая sandbox-инфраструктуру, что делает INTELLECT-3 одними из самых прозрачных проектов среди моделей свыше 100 миллиардов параметров.
По результатам тестов модель демонстрирует выдающуюся производительность в направлениях, где привычные LLM часто теряют точность: многоэтапная математика, продвинутая генерация кода и задачи, требующие длительного удержания состояния окружения. Модель сумела обойти такие топовые открытые нейросети, как DeepSeek R1, GLM-4.5 и GLM-4.5-Air. Разработчики подчеркивают, что INTELLECT-3 создавалась не как “модель для чата”, а как основа для высокоуровневых агентных систем и автономных рассуждающих сред, поэтому в языковых операциях она не отличается высокой эффективностью. Открытому сообществу доступны технический отчёт, инструменты RL-стека, а также репозиторий модели на Hugging Face.
INTELLECT-3 — это крайне интересный представитель масштабных ИИ-моделей open-source сообщества. INTELLECT-3 способна усилить конкуренцию среди моделей, ориентированных на сложные рассуждения и агентские операции, а также эта передовая нейросеть открывает исследователям доступ к реальному, полнофункциональному программному стеку для работы с продвинутым RL и верификацией. Такая открытость может ускорить развитие всего направления размышляющих ИИ и дать толчок новой волне исследований в агентных системах.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.