Компания Z-ai представила GLM-5 — новое поколение флагманской китайской ИИ-модели, ориентированной на разработку сложных коммерческих пайплайнов и выполнение агентных задач с огромными объемами контекста. По сравнению с предыдущей моделью GLM-4.7, архитектура GLM-5 была существенно переработана и масштабирована: общий объем параметров увеличен с 355 до 744 млрд, активных параметров — с 32 до 40 млрд, а объем данных предварительного обучения расширен с 23 до 28,5 трлн токенов. Дополнительно интегрирована технология DeepSeek Sparse Attention (DSA), позволяющая снизить вычислительные затраты при сохранении способности эффективно работать с длинным контекстом.
Подробнее о GLM-5
Существенный прирост качества обеспечен не только масштабированием количества параметров, но и пересмотром посттренировочной оптимизации. Для этого была разработана инфраструктура асинхронного обучения с подкреплением “slime”, направленная на устранение низкой эффективности классических RL-пайплайнов для больших языковых моделей. Новый подход позволяет проводить более частые и точные итерации дообучения, что сокращает разрыв между базовой компетентностью модели и ее практической точностью в сложных задачах.
В академических и логических бенчмарках GLM-5 демонстрирует заметный прогресс относительно GLM-4.7. В Humanity’s Last Exam модель набирает 30,5 балла против 24,8 у предыдущей версии, а в конфигурации с инструментами — 50,4 против 42,8. В математических соревнованиях уровень остается стабильно высоким: 92,7 на AIME 2026 I и 96,9 на HMMT Nov. 2025. В IMOAnswerBench показатель достигает 82,5, что близко к лучшим результатам в классе. В задачах программирования GLM-5 показывает 77,8 на SWE-bench Verified и 73,3 на SWE-bench Multilingual, улучшая позиции относительно GLM-4.7 и конкурируя с ведущими проприетарными моделями. В агентных сценариях прирост еще более выражен: в Terminal-Bench 2.0 (Terminus 2) модель достигает 56,2 / 60,7 в верифицированной версии против 41,0 у GLM-4.7. В CyberGym результат увеличен до 43,2 по сравнению с 23,5 у предыдущего поколения. В MCP-Atlas показатель составляет 67,8 против 52,0 ранее. В задачах управления контекстом GLM-5 набирает 62,0 в BrowseComp и 75,9 при включенном управлении контекстом, что отражает улучшенную стратегию сохранения и перераспределения информации в длинных диалогах. В τ²-bench модель достигает 89,7, а в прикладном Vending Bench 2 демонстрирует экономический результат $4,432.12 против $2,376.82 у GLM-4.7.
Производительность ИИ-модели GLM-5 в сравнении с флагманскими проприетарными LLM. Источник: .
Выводы
Передовая модель GLM-5 сочетает значительное архитектурное масштабирование, оптимизацию внимания через DSA и переработанную инфраструктуру RL-slime, что дает системный прирост в логике, кодировании и агентных задачах. Модель существенно превосходит GLM-4.7 по большинству ключевых метрик и сокращает разрыв с проприетарными флагманами в сложных инструментальных и терминальных сценариях, оставаясь одним из наиболее производительных решений среди open-source моделей. Модель уже доступна для скачивания на в базовой и FP8-версии.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.