Лаборатория Tongyi, являющаяся структурой компании Alibaba, представила Tongyi DeepResearch — агентская языковую модель с 30 миллиардами общих параметров на базе архитектуры MoE. Система специализируется на решении сложных задач, связанных с глубоким поиском информации, и демонстрирует высочайшую производительность в агентских тестах.
Подробнее о Tongyi DeepResearch
Благодаря архитектуре MoE, модель Tongyi DeepResearch активирует лишь 3 миллиарда параметров на токен при 30 миллиардах полных параметров, что обеспечивает экономичный и эффективный локальный инференс на пользовательских устройствах. Компания отмечает, что Tongyi DeepResearch предлагает ряд инновационных интеграций, в частности, модель имеет высокомасштабируемый конвейер синтеза данных, функционирующий автономно и обеспечивающий полный цикл обучения — от агентного предварительного обучения до контролируемой тонкой настройки и обучения с подкреплением. Помимо этого, использование разнообразных высококачественных данных агентского взаимодействия позволило внедрить расширенный функционал и повысить производительность инференса Tongyi DeepResearch, а система оценки информации, механизм фильтрации и адаптивный механизм оптимизации с градиентами политик на уровне токенов открывает возможность выполнять эффективное дообучение ИИ-агента. Tongyi-DeepResearch поддерживает два режима работы — ReAct для базовых задач и продвинутый режим на базе IterResearch для достижения максимальной производительности. В бенчмарках BrowserComp-EN, BrowserComp-ZH, GAIA, Humanity's Last Exam, xbench-DeepSearch и WebWalkerQA ИИ-агенту Tongyi-DeepResearch удалось достичь высочайшего бала в сравнении с решениями таких конкурентов, как OpenAI, Kimi, DeepSeek и других передовых ИИ-компаний. Передовой веб-агент уже доступен для скачивания в официальном репозитории Tongyi Lab на Hugging Face.
Результаты тестирования Tongyi-DeepResearch в сравнении с конкурентами. Источник: .
Выводы
Alibaba продолжает штурм рынка ИИ, всего за месяц представив целую россыпь как универсальных, так и нишевых LLM. Вполне возможно, что китайский ИИ-гигант пытается таким образом прогреть аудиторию в преддверии релиза чего-то по-настоящему революционному, и на эту позицию уже есть кандидат — полноценный релиз облачной нейросети Qwen3-Pax, предварительная версия которой была представлена в начале сентября.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.