Google представила Gemini Omni Flash: универсальная модель для создания и редактирования видеоконтента

19.05.2026

~ 2 мин

399

Простой

Новости

Введение

Google анонсировала семейство новейших ИИ-моделей Gemini Omni Flash, предназначенных для генерации и редактирования высококачественного контента из практически любых исходных данных: изображений, аудио, видео и текста. Пока что нейронка способна генерировать только видео, однако благодаря своей широчайшей универсальность нейросеть также будет генерировать фотореалистичные изображения и аудиозаписи в ближайшем будущем. Gemini Omni Flash — уже доступна пользователям через веб-интерфейсы Google, а в скором времени модель добавят в API.

Подробнее о Gemini Omni Flash

Главная особенность Omni Flash заключается в объединении глубокого логического мышления, свойственного моделям Gemini, с креативной генерацией контента, свойственного Nana Banana и Veo. В отличие от предыдущих генеративных нейросетей, Omni выходит на принципиально иной уровень. Теперь пользователь может не просто генерировать статичные изображения или короткие ролики, а вести полноценный диалог с моделью для редактирования видео. Каждая последующая инструкция накладывается на предыдущие: персонажи сохраняют естественность поведения, физика не ломается, а модель помнит все, что происходило ранее, и в точности повторяет это в сцене.

Кроме того, модель наделена пониманием реальной физики — гравитации, кинетической энергии, гидродинамики, аэродинамики — что позволяет сценам выглядеть намного более достоверно. Также Omni опирается на широчайшие знания Gemini об истории, науке и культурном контексте, поэтому создаваемые видеоролики не просто фотореалистичны, но и полностью осмысленны. Короткий пользовательский запрос способен породить наглядное объяснение сложной идеи или визуализацию научной концепции.

Еще одно важнейшее архитектурное преимущество модели — возможность комбинировать любые типы исходных материалов. Можно попросить модель генерировать контент на основе референсных изображений персонажей, текстовых описаний сцен, аудиодорожки с голосом по шаблону или уникальные варианты, и Omni Flash объединит это в целостное видео, выдержанное в едином визуальном стиле. На старте поддерживаются голосовые референсы, а в ближайшее время добавятся и другие типы аудиовходов.

Особое внимание уделено ответственному подходу. На первом этапе пользователи могут создавать видео со своим цифровым аватаром, который выглядит и звучит как реальный человек. Функция редактирования чужой речи и звука пока находится на стадии тестирования, и компания изучает, как внедрить ее безопасно. Все сгенерированные видео маркируются невидимым цифровым водяным знаком SynthID; проверить происхождение контента можно через приложение Gemini, Gemini в Chrome и поиск Google.

Gemini Omni Flash будет доступна для всех подписчиков тарифов Google AI Plus, Pro и Ultra через приложение Gemini и платформу Google Flow. В течение этой недели модель бесплатно появится и в инструментах для создателей контента — YouTube Shorts и YouTube Create App. Разработчики и корпоративные клиенты получат доступ через API в ближайшие недели.

Выводы

Google в своей передовой модели Gemini Omni Flash делает ставку на полную мультимодальность, где генерация видео перестает быть изолированной функцией и становится частью единой ИИ-экосистемы Gemini. Модель не просто создает красивую картинку, а понимает физику мира, опирается на реальные знания и способна вести связный диалог при редактировании. Такой подход стирает грань между инструментом для творчества и средой для моделирования сложных идей.

Автор:

Serverflow