MiniMax-M2.1: топовая модель для кодинга и агентов вышла в open-source

27.12.2025

~ 2 мин

596

Простой

Новости

Введение

Китайский ИИ-стартап MiniMax выпустил модель MiniMax-M2.1 с открытым исходным кодом, выведя агентский ИИ для кодинга на новый уровень. Это не просто минорный апдейт, а масштабный релиз, который имеет все шансы сделать автономные ИИ-модели не закрытыми экосистемами, а открытыми средами, доступными для локального и промышленного использования.

Подробнее о MiniMax-M2.1

Модель MiniMax-M2.1 объемом 229 миллиардов параметров проектировалась как универсальная агентная модель с упором на практические сценарии: написание и анализ кода, устойчивое использование инструментов, строгое следование инструкциям и долгосрочное планирование. В MiniMax подчеркивают, что модель ориентирована на создание автономных приложений нового поколения — от автоматизации многоязычной разработки ПО до сложных многошаговых офисных и корпоративных процессов. При этом ключевой акцент сделан на прозрачности, управляемости и воспроизводимости поведения, что критично для реальных агентных систем. Модель доступна сразу в нескольких формах. API MiniMax-M2.1 открыт на публичной платформе MiniMax, фирменный продукт MiniMax Agent на ее основе стал общедоступным, а веса модели выложены в Hugging Face и ModelScope, что позволяет запускать M2.1 локально без привязки к облаку.

По результатам внутренних и сравнительных тестов MiniMax-M2.1 демонстрирует заметный рост по сравнению с предыдущей версией M2. В задачах, ориентированных на разработчиков, модель существенно улучшила показатели на SWE-bench Verified, Multi-SWE-bench и Terminal-bench 2.0, а в многоязычных сценариях она обходит Claude Sonnet 4.5 и в ряде случаев вплотную приближается к Claude Opus 4.5. Особенно подчеркивается стабильность поведения в агентных фреймворках и высокая воспроизводимость результатов при повторных запусках. Отдельного внимания заслуживает новый бенчмарк VIBE, разработанный самой MiniMax для оценки способности модели создавать полноценные приложения с нуля. В отличие от классических тестов, VIBE проверяет не только корректность кода, но и интерактивную логику, визуальное качество и поведение приложения в реальной среде исполнения с использованием парадигмы Agent-as-a-Verifier. В этом тесте MiniMax-M2.1 показала средний результат 88,6 балла, особенно выделившись в веб-сценариях и Android-сценариях, что подчеркивает ее пригодность для full-stack и продуктовой разработки.

Дополнительные измерения, включая Toolathlon, BrowseComp, MMLU-Pro, GPQA-D и IFBench, показывают устойчивый прогресс по сравнению с M2 как в работе с инструментами на длинных горизонтах, так и в комплексных показателях «общего интеллекта». При этом MiniMax прямо указывает на методологию тестирования, фиксированные агентные фреймворки и усреднение результатов по нескольким прогонам, что повышает доверие к опубликованным цифрам.

Результаты тестирования модели MiniMax-M2.1. Источник: Hugging Face.

Выводы

MiniMax-M2.1 выглядит как серьезная заявка на роль открытой агентной модели уровня проприетарных аналогов. Компания позиционирует ее не как очередной ИИ эксперимент, а как основу для реальных автономных систем, способных конкурировать с топовыми ИИ-решениям рынка.

Автор:

Serverflow