На конференции I/O 2025 компания Google представила свою новейшую генеративную ИИ-модель, которая может не только создает высококачественные видеоролики, но и звуковое сопровождение к ним, причем, по одному текстовому запросу. Ранее ни одна нейросеть от конкурентов не могла интегрировать в визуальный ряд и аудиосопровождение.
Подробнее о Veo 3
Veo 3 — это новое поколение языковых моделей для генерации видеоматериалов, в основу которой легла нейросеть Google DeepMind. Veo 3 способна генерировать фотореалистичные видеоролики в разрешении 4K (4096×2160 пикселей), используя текстовые, графические или видео-подсказки. Сгенерированные видео через нейросеть Veo 3 также имеют нативные аудиоряд, вроде синхронных диалогов, фоновых шумов и звуковых эффектов, соответствующих содержанию видео. Среди других особенностей Veo 3 можно выделить максимально реалистичную имитацию физических явлений, таких как освещение и гидродинамика, благодаря чему готовые видео выглядят максимально детализировано. А благодаря улучшенному алгоритму внимания, Veo 3 точно следует пользовательским запросам и способна повторять движения камеры, удалять объекты или улучшать качество видеоролика в соответствии с референсным изображением, видео или текстовым запросом. Кроме того, Veo 3 также поддерживает интеграцию с инструментом Flow для создания раскадровки и сцен на кинематографическом уровне. Также Google позаботилась о том, чтобы злоумышленники не использовали передовые возможности Veo 3 в своих интересах, добавив в нейросеть функцию оснащения всех видеороликов невидимой вотермаркой SynthID.
Выводы
По сути, Veo 3 сделала настоящий прорыв, поскольку предыдущие генеративные ИИ для создания видео, такие как Sora, могли генерировать лишь немые видео и не имели функции аудиовизуального синтеза. На фоне этого, многие художники, мультипликаторы и режиссеры выражают огромную обеспокоенность достижениями разработчиков искусственного интеллекта в области генерации видео, поскольку уже сейчас возможности нейросетей практически подобрались к тому уровню, когда визуальные видеоматериалы будет невозможно отличить от реальных кадров. Передовая ИИ-модель уже доступна в приложении Gemini для подписчиков тарифа AI Ultra стоимостью $249 в месяц, а также на веб-платформе Veo 3 по тарифам от $4,95 до $49,9 в месяц, но количество создаваемых видеороликов в веб-платформе ограничено.
Не решили они только проблему с длиной роликов, получается если я захочу сделать какой нибудь фильм или мультик мне придется раз 1000 писать промпты, и склеивать ролики которые скорее всего будут отличаться друг от друга так сильно что повествование будет просто рваным, как и собственно анимация ввиду постоянных резких переходов от ролика к ролику
Serverflow
Режиссер Даррен Аронофски помогал компании в создании, и один из его фильмов и выйдет с использованием нейросети. Будем смотреть, какой процент фильма будет сгенерирован, и как хорошо он будет выглядеть на релизе, думаю, на него отдельный обзор запишем :)
Скидка 3 000 ₽ или бесплатная доставка — уже сейчас 🔥
Мы ценим вашу обратную связь. После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.