Top.Mail.Ru
Meta* представила Muse Spark — новая модель, старые ошибки | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Бонус за
обратную связь
Интернет-магазин
Серверного оборудования
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Meta* представила Muse Spark — новая модель, старые ошибки

~ 2 мин
29
Простой
Новости
Meta* представила Muse Spark — новая модель, старые ошибки

Введение

Meta Superintelligence Labs (MSL, подразделение Meta*) выпустила Muse Spark — новую мультимодальную размышляющие ИИ-модель с поддержкой вызова инструментов, визуальной цепочки рассуждений и функциями мульти-агентной оркестрации. Это первый публичный релиз масштабной закрытой ИИ-модели компании после провального запуска Llama 4 в прошлом году. Модель уже доступна в веб-интерфейса  приложении Meta AI, а preview API открыт ограниченному кругу пользователей для тестирования

Подробнее о Muse Spark

Команда MSL полностью переработала стек предобучения нейросети: архитектуру, оптимизатор и процессы курирования данных. По внутренним оценкам, Muse Spark достигает сопоставимых с Llama* 4 Maverick возможностей, затрачивая на порядок меньше вычислительных ресурсов. Параллельно Meta* инвестирует в инфраструктуру, включая новый дата-центр Hyperion.

Согласно внутренним тестирования, в обычном Thinking-режиме модель конкурирует с Opus 4.6 Max, Gemini 3.1 Pro High, GPT-5.4 high и Grok 4.2 Reasoning. Лидерство зафиксировано лишь на трех тестах: CharXiv Reasoning (86,4), DeepSearchQA (74,8) и HealthBench Hard (42,8 против 40,1 у GPT-5.4, 20,6 у Gemini 3.1 Pro и 14,8 у Opus 4.6). На задачах абстрактного мышления и кода Muse Spark показала еще более скромные результаты: ARC-AGI-2 — 42,5 (Gemini 3.1 Pro — 76,5), GPQA Diamond — 89,5 (против 94,3), LiveCodeBench Pro — 80,0 (GPT-5.4 — 87,5). Meta* признает наличие пробелов в длинных агентских сценариях и сложных рабочих процессах программирования. Ответ Meta* на Deep Think от Gemini и Pro-режим GPT — мульти-агентная оркестрация с параллельным рассуждением нескольких агентов. Заявленные результаты: 58% на Humanity's Last Exam и 38% на FrontierScience Research. На HLE без инструментов Contemplating набирает 50,2 — выше Gemini 3.1 Deep Think (48,4) и GPT-5.4 Pro (43,9). Пользователи, успевшие протестировать Muse Spark, отмечают, что эффективность модели значительно отличается от результатов, которые приводит Muse Spark — они заявляют, что модель не справляется с типичными для своего класса задачами, такими как кодинг, логические операции и анализ данных.

Результаты тестирования Muse Spark
Результаты тестирования ИИ-модели Muse Spark.

Выводы

Muse Spark — очередная попытка Meta* вернуться ИИ-гонку, но даже спустя год компании не удалось в полной мере выровняться со своими конкурентами. Модель демонстрирует заметный прогресс в эффективности обучения и отдельных нишевых доменах вроде медицинской диагностики, однако по ключевым метрикам — абстрактному мышлению, программированию и длинным агентным сценариям — отставание от лидеров сохраняется. Флагманские решения OpenAI, Google DeepMind и Anthropic по-прежнему опережают Muse Spark в большинстве бенчмарков. Возвращение Meta* в гонку состоялось, но до реальной конкуренции за верхние строчки пока далеко.

*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена

**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)