Top.Mail.Ru
Kandinsky 5.0 от Сбер теперь в открытом доступе! | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Из-за нестабильности цен RAM фактическая стоимость может отличаться. Цена подтверждается после оформления заказа, работаем над обновлением цен!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Kandinsky 5.0 от Сбер теперь в открытом доступе!

~ 2 мин
152
Простой
Новости
Kandinsky 5.0 от Сбер теперь в открытом доступе!

Введение

Сбер опубликовал всю линейку визуальных моделей Kandinsky 5.0 в открытом доступе, выложив код и веса под лицензией MIT на Hugging Face и GitHub. Такой формат делает модели полностью свободными для модификации, интеграции и коммерческого использования, что заметно снижает порог входа для разработчиков. В ИИ-стек Kandinsky 5.0 вошли четыре ключевых компонента: Image Lite, Video Lite, Video Pro и вариационные автоэнкодеры K-VAE 1.0.

Подробнее о Kandinsky 5.0

Модели Image Lite объемом 6 миллиардов параметров, предназначенные для HD-генерации и редактирования изображений, были обучены на корпусе данных из 520 миллионов картинок, включая данные русского культурного контекста. Для улучшения производительности в задачах редактирования использовалось дополнительное дообучение на 150 миллионах пар изображений. По результатам независимых тестов модели превосходят популярную модель FLUX.1 dev в генерации и сопоставимы с нейронкой FLUX.1 Kontext по качеству редактирования. Нейросеть Video Lite объемом 2 миллиардов параметров, ориентированная генерацию видео, доступна для запуска на видеокартах от 12 ГБ и построена на данных из 520 миллионов изображений и 120 миллионов видео. По метрикам она значительно превосходит более крупную модель WAN 2.1-14B, имея в 8 раз меньшие размеры, чем у нейросети Alibaba. Video Pro является флагманской моделью для HD-видео длиной до 10 секунд и даже поддерживает управление движением камеры и ее ракурсом. Video Pro обучена на 520 миллионах изображений и 250 миллионах видео, а затем дообучена на вручную отобранных художниками роликах. По тестам SBS она превосходит Wan 2.2-A14B и при этом демонстрирует визуальное качество и динамику на уровне топовой модели Google Veo 3. Также в релиз вошло семейство K-VAE 1.0, которое включает двумерные и трехмерные автоэнкодеры со степенью сжатия 8×8 и 4×8×8. На открытых датасетах эти автоэнкодеры обеспечивают лучшее восстановление по сравнению с Hunyuan, Flux и Wan при одинаковой степени компрессии.

Пайплан Kandinsky 5.0
Пайплан Kandinsky 5.0. Источник: GitHub.

Выводы

Линейка Kandinsky 5.0 выходит не просто как набор моделей, а как полноценный открытый фреймворк с современными ИИ-архитектурами для выполнения разных типов задач генеративного ИИ. Благодаря доступности и впечатляющей производительности, линейка Kandinsky 5.0 может стать отличным решением для выстраивания эффективных рабочих процессов в популярных ИИ-интерфейсах, например, ComfyUI. Опробовать возможности Kandinsky 5.0 также можно на отечественной платформе GitVerse.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)