Google представила Veo 3 — новейшая нейросеть для ИИ-кинематографа
Автор: ServerFlow
Google представила передовую нейросеть Veo 3 для генерации видео с нативным аудиорядом.
Введение
На конференции I/O 2025 компания Google представила свою новейшую генеративную ИИ-модель, которая может не только создает высококачественные видеоролики, но и звуковое сопровождение к ним, причем, по одному текстовому запросу. Ранее ни одна нейросеть от конкурентов не могла интегрировать в визуальный ряд и аудиосопровождение.
Подробнее о Veo 3
Veo 3 — это новое поколение языковых моделей для генерации видеоматериалов, в основу которой легла нейросеть Google DeepMind. Veo 3 способна генерировать фотореалистичные видеоролики в разрешении 4K (4096×2160 пикселей), используя текстовые, графические или видео-подсказки. Сгенерированные видео через нейросеть Veo 3 также имеют нативные аудиоряд, вроде синхронных диалогов, фоновых шумов и звуковых эффектов, соответствующих содержанию видео. Среди других особенностей Veo 3 можно выделить максимально реалистичную имитацию физических явлений, таких как освещение и гидродинамика, благодаря чему готовые видео выглядят максимально детализировано. А благодаря улучшенному алгоритму внимания, Veo 3 точно следует пользовательским запросам и способна повторять движения камеры, удалять объекты или улучшать качество видеоролика в соответствии с референсным изображением, видео или текстовым запросом. Кроме того, Veo 3 также поддерживает интеграцию с инструментом Flow для создания раскадровки и сцен на кинематографическом уровне. Также Google позаботилась о том, чтобы злоумышленники не использовали передовые возможности Veo 3 в своих интересах, добавив в нейросеть функцию оснащения всех видеороликов невидимой вотермаркой SynthID.
Выводы
По сути, Veo 3 сделала настоящий прорыв, поскольку предыдущие генеративные ИИ для создания видео, такие как Sora, могли генерировать лишь немые видео и не имели функции аудиовизуального синтеза. На фоне этого, многие художники, мультипликаторы и режиссеры выражают огромную обеспокоенность достижениями разработчиков искусственного интеллекта в области генерации видео, поскольку уже сейчас возможности нейросетей практически подобрались к тому уровню, когда визуальные видеоматериалы будет невозможно отличить от реальных кадров. Передовая ИИ-модель уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц, а также на веб-платформе Veo 3 по тарифам от $4,95 до $49,9 в месяц, но количество создаваемых видеороликов в веб-платформе ограничено.
Google представила Veo 3 — новейшая нейросеть для ИИ-кинематографа
На конференции I/O 2025 компания Google представила свою новейшую генеративную ИИ-модель, которая может не только создает высококачественные видеоролики, но и звуковое сопровождение к ним, причем, по одному текстовому запросу. Ранее ни одна нейросеть от конкурентов не могла интегрировать в визуальный ряд и аудиосопровождение.
Подробнее о Veo 3
Veo 3 — это новое поколение языковых моделей для генерации видеоматериалов, в основу которой легла нейросеть Google DeepMind. Veo 3 способна генерировать фотореалистичные видеоролики в разрешении 4K (4096×2160 пикселей), используя текстовые, графические или видео-подсказки. Сгенерированные видео через нейросеть Veo 3 также имеют нативные аудиоряд, вроде синхронных диалогов, фоновых шумов и звуковых эффектов, соответствующих содержанию видео. Среди других особенностей Veo 3 можно выделить максимально реалистичную имитацию физических явлений, таких как освещение и гидродинамика, благодаря чему готовые видео выглядят максимально детализировано. А благодаря улучшенному алгоритму внимания, Veo 3 точно следует пользовательским запросам и способна повторять движения камеры, удалять объекты или улучшать качество видеоролика в соответствии с референсным изображением, видео или текстовым запросом. Кроме того, Veo 3 также поддерживает интеграцию с инструментом Flow для создания раскадровки и сцен на кинематографическом уровне. Также Google позаботилась о том, чтобы злоумышленники не использовали передовые возможности Veo 3 в своих интересах, добавив в нейросеть функцию оснащения всех видеороликов невидимой вотермаркой SynthID.
Выводы
По сути, Veo 3 сделала настоящий прорыв, поскольку предыдущие генеративные ИИ для создания видео, такие как Sora, могли генерировать лишь немые видео и не имели функции аудиовизуального синтеза. На фоне этого, многие художники, мультипликаторы и режиссеры выражают огромную обеспокоенность достижениями разработчиков искусственного интеллекта в области генерации видео, поскольку уже сейчас возможности нейросетей практически подобрались к тому уровню, когда визуальные видеоматериалы будет невозможно отличить от реальных кадров. Передовая ИИ-модель уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц, а также на веб-платформе Veo 3 по тарифам от $4,95 до $49,9 в месяц, но количество создаваемых видеороликов в веб-платформе ограничено.
Не решили они только проблему с длиной роликов, получается если я захочу сделать какой нибудь фильм или мультик мне придется раз 1000 писать промпты, и склеивать ролики которые скорее всего будут отличаться друг от друга так сильно что повествование будет просто рваным, как и собственно анимация ввиду постоянных резких переходов от ролика к ролику
Serverflow
Режиссер Даррен Аронофски помогал компании в создании, и один из его фильмов и выйдет с использованием нейросети. Будем смотреть, какой процент фильма будет сгенерирован, и как хорошо он будет выглядеть на релизе, думаю, на него отдельный обзор запишем :)
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.