Top.Mail.Ru
Moonshot AI выпустила Kimi K2.6 — открытая MoE-модель с 1 триллионом параметров | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Бонус за
обратную связь
Интернет-магазин
Серверного оборудования
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Moonshot AI выпустила Kimi K2.6 — открытая MoE-модель с 1 триллионом параметров

~ 2 мин
54
Простой
Новости
Moonshot AI выпустила Kimi K2.6 — открытая MoE-модель с 1 триллионом параметров

Введение

Китайский ИИ-стартап Moonshot AI официально представил свою флагманскую модель Kimi K2.6 с открытым исходным кодом. Kimi K2.6 — это нативная мультимодальная агентная система, построенная по архитектуре Mixture-of-Experts с 1 триллионом общих и 32 активных параметров. Разработчики позиционируют K2.6 как качественный скачок от просто “думающей модели” к полноценному агенту-исполнителю, способному автономно решать сложные многочасовые задачи с привлечением сотен параллельных субагентов.

Подробнее о Kimi K2.6

Архитектура Kimi K2.6 базируется на своем предшественнике в лице K2.5, сохраняя полную совместимость с существующей инфраструктурой развертывания, включая движки vLLM, SGLang и KTransformers. Модель насчитывает 61 слой, из которых один плотный, а остальные включают механизм Multi-head Latent Attention и функцию активации SwiGLU. Архитектура включает 384 эксперта, причем на каждый токен активируется лишь 8 специализированных плюс 1 общий эксперт. Длина контекста модели достигает 256 тысяч токенов, а за визуальное восприятие обеспечивает кодировщик MoonViT с 400 миллионами параметров.

Главное преимущество K2.6 заключается в ее агентных способностях, которые разработчики условно разделяют на четыре направления. В области долгосрочного кодирования модель значительно улучшила выполнение сложных комплексных задач, успешно применяя свои навыки в различных языках программирования, включая Rust, Go и Python, а также в таких областях, как фронтенд, DevOps и оптимизация производительности. В проектировании на основе кодирования K2.6 способна преобразовывать простые текстовые подсказки и визуальные данные в готовые к использованию интерфейсы и легковесные комплексные рабочие процессы, генерируя структурированные макеты, интерактивные элементы и богатую анимацию с продуманной эстетической точностью.

Особого внимания заслуживает усовершенствованный рой агентов, позволяющий модели горизонтально масштабироваться до 300 субагентов, выполняющих 4000 скоординированных шагов. Система динамически разбивает задачи на параллельные специализированные подзадачи, обеспечивая сквозную обработку данных, от документов до веб-сайтов и электронных таблиц, за один автономный запуск. Дополняет картину проактивная и открытая оркестровка: K2.6 демонстрирует высокую производительность при выполнении автономных задач с помощью постоянно работающих фоновых агентов, которые круглосуточно управляют расписаниями, выполняют код и координируют кроссплатформенные операции без участия человека.

Результаты оценки на независимых бенчмарках подтверждают заявленные возможности. На HLE-Full с инструментами Kimi K2.6 набирает 54%, опережая GPT-5.4 с 52% и Claude Opus 4.6 с 53%. В BrowseComp модель достигает 83%, а при использовании агентского роя результат поднимается до 86%. На DeepSearchQA показатель F1 составляет 92% при точности 83%, что значительно выше, чем у GPT-5.4 с точностью 63%. В тесте Terminal-Bench 2.0, оценивающем работу с терминалом, Kimi K2.6 показывает 66%, немного уступая Gemini 3.1 Pro с 68%, но опережая GPT-5.4 и Claude Opus 4.6. На SWE-Bench Pro модель набирает 58%, что выше 57% у GPT-5.4 и 53% у Opus 4.6. В мультимодальных задачах, таких как MathVision с использованием Python, результат достигает 92%, а на V* — 96%.

Производительность Kimi K2.6
ИИ-производительность Kimi K2.6. Источник: Hugging Face.

Выводы

Kimi K2.6 представляет собой серьезную заявку Moonshot AI на лидерство в сегменте открытых агентных моделей. Триллион параметров на MoE-архитектуре дает уникальное сочетание глубины знаний и вычислительной эффективности, а возможность масштабирования до 300 параллельных субагентов открывает принципиально новые сценарии автономной работы. Превосходство над GPT-5.4 и Claude Opus 4.6 по ряду ключевых метрик — HLE-Full, DeepSearchQA, SWE-Bench Pro — подтверждает, что китайский стартап не просто догоняет лидеров, но и задает собственные стандарты в агентном исполнении.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)