Китайская компания Bytedance выпустила ИИ-агента Seed 1.8, ориентированного на выполнение сложных цепочек действий. Модель мультимодальна работает как с текстом, так и с визуальными данными, отлично справляется с обработкой видео и демонстрирует выдающиеся результаты в сценариях с длинным контекстом.
Подробнее о Seed 1.8
За счет объединения языкового и визуального энкодера модель Seed 1.8 можно использовать в задачах поиска информации, редактирования и анализа кода, взаимодействия с GUI и интерпретации сложных, многоэтапных цепочек действий. При создании Seed 1.8 команда Bytedance делала акцент на инструментальном взаимодействии, что позволяет модели не просто рассуждать, а последовательно выполнять действия в рамках заданного сценария.
Тестирование Seed 1.8 проводилось сразу в нескольких бенчмарках. Рассматривались агентные навыки, традиционные тесты LLM и vidion-сценарии. Для этого использовались как внутренние, так и общедоступные индустриальные бенчмарки. Наиболее заметный рост Seed 1.8 показала именно в агентных сценариях. По сравнению с предыдущим флагманом Seed 1.5-VL, нейросеть Seed 1.8 существенно превзошла предшественника в области распознавания GUI. В задачах поиска данных Seed 1.8 удерживает верхний уровень в ряде популярных агентных бенчмарков, а в тесте BrowseComp-en набрала 67,6 балла, опередив другие топовые модели сегмента open-source. В агентном программировании модель Seed 1.8 смогла эффективно вносить корректировки в код, работать с внешними инструментами и действовать в сложных средах. Особое внимание разработчики уделяют тому, что модель показывает практическую ценность в сценариях, связанных с реальными рабочими процессами.
В традиционных языковых бенчмарках Seed 1.8 сохраняет стабильный уровень, сопоставимый с современными универсальными моделями. В задачах математического рассуждения, сложного следования инструкциям и проверки знаний результаты находятся на уровне актуального мейнстрима. Модель остается конкурентоспособной при обработке информации, извлечении данных, распознавании намерений пользователя и управлении многошаговыми рабочими цепочками.
В области vision-распознавания Seed 1.8 превосходит Seed 1.5-VL и в большинстве тестов приближается к текущему уровню ведущих моделей, включая Gemini-3-Pro. Но особенно сильно модель выделилась в области распознавания видео. Seed 1.8 уверенно справляется с видеоаналитикой, распознаванием движений, восприятием сцен и обработкой длинных роликов, сохраняя точность при учете временной структуры и динамического контента.
Выводы
ИИ-модель Seed 1.8 демонстрирует намерение Bytedance продолжать двигаться в сторону полноценных, высокоэффективных агентных систем с мультимодальными возможностями, способных работать и с текстом, и с изображениями, и с видео в рамках реальных, прикладных сценариев использования. В сравнении со своим предшественником Seed 1.5-VL, модель Seed 1.8 показывает заметный прогресс в агентных задачах, визуальном понимании и работе с длинным контекстом, сохраняя при этом конкурентоспособный уровень производительности в традиционных LLM-тестах.
Интересно, насколько эффективно Seed 1.8 справляется с реальными рабочими задачами в долгосрочной перспективе, если она еще не прошла широкое внедрение в индустрию.
Serverflow
Модель уже демонстрирует отличные результаты в агентных задачах и обработке видео, что подтверждают её успехи в реальных сценариях с индустриальными бенчмарками. Это указывает на её практическую ценность, несмотря на недавний релиз :)
Скидка 3 000 ₽ или бесплатная доставка — уже сейчас 🔥
Мы ценим вашу обратную связь. После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.