Google представила Veo 3 — новейшая нейросеть для ИИ-кинематографа

23.05.2025

~ 2 мин

1357

Простой

Новости

Введение

На конференции I/O 2025 компания Google представила свою новейшую генеративную ИИ-модель, которая может не только создает высококачественные видеоролики, но и звуковое сопровождение к ним, причем, по одному текстовому запросу. Ранее ни одна нейросеть от конкурентов не могла интегрировать в визуальный ряд и аудиосопровождение.

Подробнее о Veo 3

Veo 3 — это новое поколение языковых моделей для генерации видеоматериалов, в основу которой легла нейросеть Google DeepMind. Veo 3 способна генерировать фотореалистичные видеоролики в разрешении 4K (4096×2160 пикселей), используя текстовые, графические или видео-подсказки. Сгенерированные видео через нейросеть Veo 3 также имеют нативные аудиоряд, вроде синхронных диалогов, фоновых шумов и звуковых эффектов, соответствующих содержанию видео. Среди других особенностей Veo 3 можно выделить максимально реалистичную имитацию физических явлений, таких как освещение и гидродинамика, благодаря чему готовые видео выглядят максимально детализировано. А благодаря улучшенному алгоритму внимания, Veo 3 точно следует пользовательским запросам и способна повторять движения камеры, удалять объекты или улучшать качество видеоролика в соответствии с референсным изображением, видео или текстовым запросом. Кроме того, Veo 3 также поддерживает интеграцию с инструментом Flow для создания раскадровки и сцен на кинематографическом уровне. Также Google позаботилась о том, чтобы злоумышленники не использовали передовые возможности Veo 3 в своих интересах, добавив в нейросеть функцию оснащения всех видеороликов невидимой вотермаркой SynthID.

Выводы

По сути, Veo 3 сделала настоящий прорыв, поскольку предыдущие генеративные ИИ для создания видео, такие как Sora, могли генерировать лишь немые видео и не имели функции аудиовизуального синтеза. На фоне этого, многие художники, мультипликаторы и режиссеры выражают огромную обеспокоенность достижениями разработчиков искусственного интеллекта в области генерации видео, поскольку уже сейчас возможности нейросетей практически подобрались к тому уровню, когда визуальные видеоматериалы будет невозможно отличить от реальных кадров. Передовая ИИ-модель уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц, а также на веб-платформе Veo 3 по тарифам от $4,95 до $49,9 в месяц, но количество создаваемых видеороликов в веб-платформе ограничено.

Автор:

Serverflow

Комментарии 1

Стена в Мексике

Не решили они только проблему с длиной роликов, получается если я захочу сделать какой нибудь фильм или мультик мне придется раз 1000 писать промпты, и склеивать ролики которые скорее всего будут отличаться друг от друга так сильно что повествование будет просто рваным, как и собственно анимация ввиду постоянных резких переходов от ролика к ролику

Режиссер Даррен Аронофски помогал компании в создании, и один из его фильмов и выйдет с использованием нейросети. Будем смотреть, какой процент фильма будет сгенерирован, и как хорошо он будет выглядеть на релизе, думаю, на него отдельный обзор запишем :)