Top.Mail.Ru
Kimi K2.5: новый флагман Moonshot AI с режимом “рой агентов” | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Kimi K2.5: новый флагман Moonshot AI с режимом “рой агентов”

~ 2 мин
372
Простой
Новости
Kimi K2.5: новый флагман Moonshot AI с режимом “рой агентов”

Введение

Moonshot AI представила Kimi K2.5 — новую мультимодальную версию своей флагманской мультимодальной модели на архитектуре MoE с 1 триллионом общих и 32 миллиардов активных параметров, которая делает ставку не столько на рост чистой производительности, сколько на практическую агентную эффективность. Ключевая особенность релиза — режим Agent Swarm, позволяющий модели динамически создавать десятки параллельных субагентов и координировать масштабную работу с инструментами в рамках одной сессии. Kimi K2.5 позиционируется полностью открытый агентный ИИ для сложных прикладных задач, где важны скорость, параллелизм и работа с реальными источниками данных, а не только идеальные результаты на олимпиадных бенчмарках.

Подробнее о Kimi K2.5

В основе Kimi K2.5 лежит предыдущая модель K2, дообученная на массиве из примерно 15 триллионов мультимодальных токенов. Это обучение усилило способности модели в работе с текстом, изображениями и видео, а также улучшило связку визуального восприятия и генерации кода. Главным архитектурным новшеством стал режим Agent Swarm, реализованный через метод PARL — Parallel-Agent Reinforcement Learning. Вместо классического последовательного агента K2.5 использует обучаемый оркестратор, который декомпозирует задачу на подзадачи и распределяет их между “замороженными” субагентами, работающими параллельно. Такой подход решает проблему последовательного коллапса, когда модель формально умеет вызывать инструменты, но на практике выполняет все шаг за шагом. В K2.5 это компенсируется специальной метрикой Critical Steps и многоступенчатой схемой вознаграждения, которая поощряет именно параллельное выполнение задач.

Благодаря этому модель может одновременно задействовать до сотни субагентов и координировать до полутора тысяч инструментальных вызовов за одну сессию. По заявлению Moonshot AI, это ускоряет выполнение сложных задач до 4,5 раза по сравнению с одиночным агентом и позволяет эффективно решать сценарии, связанные с широким поиском информации, агрегацией данных и генерацией больших объемов контента. В бенчмарках агентного поиска Agent Swarm показывает заметное преимущество: на BrowseComp результат достигает 78,4 балла против 60,6 у одиночной K2.5 и около 37 у Claude Opus 4.5.

Kimi K2.5 активно продвигается как инструмент для “визуального кодинга”: модель способна генерировать код, анализируя видеозапись экрана, и в демонстрациях воссоздает веб-интерфейсы, буквально “смотря” на процесс их использования. Заявлен и автономный визуальный дебаггинг, при котором модель сама оценивает результат своей работы по визуальному отклику и итеративно вносит исправления. Для разработчиков представлен Kimi Code — open-source терминальный инструмент, интегрируемый с популярными IDE и редакторами, поддерживающий изображения и видео на входе и автоматическую работу с MCP-конфигурациями.

В визуальных бенчмарках модель лидирует: на OCRBench, InfoVQA и MathVista она обходит GPT-5.2 и демонстрирует лучшие результаты в классе. При этом в чистом reasoning без агентного параллелизма она уступает топовым конкурентам: на AIME 2025 и GPQA-Diamond показатели ниже, чем у GPT-5.2. Именно здесь и проявляется стратегия Moonshot AI — компенсировать отставание в академических тестах за счет агентной архитектуры, которая выигрывает в реальных прикладных задачах. Дополнительно компания заявляет существенную экономию: от пяти до двадцати одного раза дешевле по сравнению с GPT-5.2 при сопоставимом качестве в практических сценариях.

ИИ-производительность Kimi K2.5
ИИ-производительность Kimi K2.5 в сравнении с проприетарными моделями. Источник: Kimi.

Выводы

Kimi K2.5 — это показательный пример смещения фокуса с чистой производительность в размышлениях к масштабируемому агентному выполнению задач с помощью параллельных агентов. Бесплатные режимы Instant и Thinking делают модель доступной широкой аудитории, а Agent Swarm превращает ее в инструмент для тяжелых прикладных сценариев, где важны параллельный поиск, работа с множеством источников и длинные цепочки действий. Несмотря на то что в классических интеллектуальных бенчмарках K2.5 не всегда дотягивает до лидеров рынка, в реальных агентных задачах она выглядит конкурентоспособно и экономически выгодно. Фактически Moonshot AI предлагает альтернативное видение прогресса ИИ: не максимизация одного агента, а оркестрация целого роя, работающего как единая система.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)