Top.Mail.Ru
Релиз MiniMax M3 — открытая мультимодальная модель с 428 миллиардов параметров и 1 миллионом токенов контекста | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Бонус за
обратную связь
12 июня - выходной день. Все заявки будут обработаны 15 июня. Поздравляем с Днем России!
Интернет-магазин
Серверного оборудования
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Релиз MiniMax M3 — открытая мультимодальная модель с 428 миллиардов параметров и 1 миллионом токенов контекста

~ 2 мин
31
Простой
Новости
Релиз MiniMax M3 — открытая мультимодальная модель с 428 миллиардов параметров и 1 миллионом токенов контекста

Введение

Китайская ИИ-лаборатория MiniMax официально выпустила свою флагманскую модель MiniMax M3 в открытый доступ. Модель на базе архитектуры MoE имеет 428 миллиардов общих параметров и 23 миллиардов активных параметров, встроенную мультимодальность, огромное контекстное окно в 1 миллион токенов и использует собственный механизм внимания, который значительно увеличивает эффективность нейронки в задачах кодинга и выводит ее в один сегмент с топовыми закрытыми LLM в той же весовой категории. Веса модели и технический отчет уже доступны на HuggingFace и GitHub.

Подробнее о MiniMax M3

MiniMax M3 с самого начала проектировалась как нативно мультимодальная нейросеть, а не как текстовая LLM-модель с интегрированным визуальным декодером, который увеличивает время обработки запроса. Текст, изображения и видео подаются в обучающий пайплайн одновременно и с одинаковым приоритетом, что, по утверждению разработчиков, дает более глубокую семантическую связку модальностей и увеличивает эффективность выполнения сложных задач. Общий объем параметров составляет 428 миллиардов, из них в каждый момент активируются только 23 миллиарда параметров благодаря архитектуре Mixture of Experts, что увеличивает скорость логического вывода и снижает требования к локальному инференсу.

Ключевое нововведение модели MiniMax M3 — технология, MiniMax Sparse Attention (MSA), которая представляет из себя высокопроизводительного оператора разреженного внимания, заменяющего стандартное групповое внимание запросов в трансформерных ИИ-архитектурах. По сравнению с моделью MiniMax M2, на контексте в 1 миллион токенов технология MSA дает 9-кратное ускорение предварительного заполнения и 15-кратное ускорение декодирования, а вычислительные затраты на каждый токен падают до 1/9 от уровня предыдущего поколения нейросетей компании. Благодаря этой интеграции, модель не просто забивает контекст в 1 миллион токенов — она действительно способна экономично и эффективно в нем работать, что критически важно для многочасовых агентных пайплайнов и анализа многотысячных кодовых баз.

На самом популярном кодингвом бенчмарке SWE-Bench Pro модель MiniMax M3 набирает 59,0% — результат, ставящий ее в один ряд с Opus 4.7 и выше многих открытых моделей. В Terminal Bench 2.1 модель получает 66,0%. Самый громкий успех — агентный тест BrowseComp, в котором MiniMax M3 достигает 83,5%, впервые обходя Claude Opus 4.7 с его 79,3%. В агентных и инструментальных тестах M3 также держится уверенно: MCP Atlas — 74,2%, BankerToolBench — 76,1%, что ставит ее на одну ступень с проприетарными лидерами. При этом в KernelBench Hard модель MiniMax M3 пока уступает топовым проприетарным решениям.

ИИ-производительность MiniMax M3
Результаты тестирования модели MiniMax M3. Источник: X.

Помимо тестов, MiniMax приводит два кейса, демонстрирующих способности MiniMax M3 к долгой автономной работе. В первом модель получила задание воспроизвести научную статью с конференции ICLR 2025 — она самостоятельно работала почти 12 часов, сделала 18 коммитов в репозиторий и построила 32 экспериментальных графика, полностью повторив эксперименты без вмешательства человека. Во втором кейсе M3 поручили оптимизировать вычислительное ядро для GPU NVIDIA: примерно за сутки модель выполнила 147 итераций и почти 2000 вызовов инструментов, подняв утилизацию железа с 7,6% до 71,3% — ускорение в 9,4 раза. На бенчмарке PostTrainBench, оценивающем умение моделей самостоятельно обучать другие модели, M3 заняла третье место, уступив только Opus 4.7 и GPT-5.5.

Выводы

Релиз открытых весов MiniMax M3 укрепляет положение китайских ИИ-разработчиков на рынке open-source нейросетей, а ее результаты тестирования и, что самое главное, превосходство над проприетарными моделями в определенных бенчмарках, делают MiniMax M3 одним из лидеров на рынке открытых LLM. Для работы с нейронкой MiniMax M3 китайский ИИ-стартап рекомендует использовать фреймворки SGLang, vLLM и Transformers, а также доступен запуск через агентную среду Agent MiniMax. Веса модели MiniMax M3 доступны на Hugging Face и GitHub под лицензией minimax-community.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)