ИИ-подразделение компании Сбер на недавней конференции AI Journey объявила о выходе передовых нейросетей в open-source. О моделях Kandinsky 5.0 мы уже рассказывали вам ранее, но помимо нее Сбер также представила ASR-систему GigaAM-v3 и топовые LLM GigaChat Ultra Preview и Lightning. Все модели распространяются под открытой лицензией MIT, что позволяет использовать их не только в исследовательских целях, но и даже в коммерческих продуктах.
Подробнее о открытых моделях GigaChat и GigaAM-v3
В линейку открытых моделей GigaChat вошли две нейросети — Ultra Preview и Lightning. Оба решения базируются на архитектуре MoE, отлично справляются с языковыми операциями на русском языке и обеспечивают высочайшую производительность в различных задачах. GigaChat Ultra Preview — старшая и наиболее мощная модель Сбера с контекстным окном до 128 тысяч токенов, которая демонстрирует эффективность, превышающую производительность топовой открытой нейросети DeepSeek V3.1 на русском языке в бенчмарке MERA. Доступна базовая модель, а также версии с формате FP8/BF32, количество параметров достигает 702 миллиардов общих и 36 миллиардов активных, при этом обучение отечественного флагмана все еще продолжается. GigaChat Lightning является более легкой и ориентирована на локальный запуск с максимальной скоростью генерации. Модель имеет 10 миллиардов общих и 1,8 миллиардов активных параметров, обеспечивая большую производительность, чем Qwen3-4B, при этом она работает быстрее, чем Qwen3-1.7B.
Также был представлен новый набор нейросетей GigaAM-v3 для распознавания русской речи. Это пять высокоточных ASR-моделей промышленного класса, которые можно использовать для построения голосовых ассистентов, call-аналитики, мультимодальных агентов и любых решений, связанных с распознаванием речи. В семейство вошли: самообучающийся кодировщик HuBERT–CTC, предварительно обученный на 700 000 часах русской речи, две модели автоматического распознавания речи на базе декодеров CTC и RNN-T, а также две сквозные модели с нормализацией пунктуации и текста. Разработчики отметили, что GigaAM-v3 допускает на 50% меньше ошибок при распознавании русской речи, чем Whisper-large-v3 от OpenAI.
Пайплайн ASR-системы GigaAM-v3. Источник: .
Вице-президент Сбера Андрей Белевцев отметил, что открытие весов — это стратегический шаг. По его словам, настоящий технологический суверенитет достигается не закрытыми системами, а открытой инфраструктурой, которой может пользоваться вся страна. Открытие весов GigaChat, GigaAM-v3 и Kandinsky 5.0 стало самым крупным open-source релизом за последнее время, что подчеркивает успех команды Сбер.
Выводы
Открытие весов GigaChat, GigaAM-v3 и Kandinsky 5.0 — это переломный момент для отечественной ИИ-экосистемы. Сбер показал, что российские ИИ-модели могут успешно конкурировать с топовыми игроками на рынке, а наши разработчики способны создавать инновации, укрепляющие технологический суверенитет российских компаний. Веса открытых ИИ-моделе Сбер доступны на и .
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.