Google представила Gemini Omni Flash
Google представила Gemini Omni Flash — новую мультимодальную модель для создания и редактирования видео на конференции I/O 2026. Модель принимает на вход любую комбинацию текста, изображений, аудио и видео и генерирует ролики длиной до 10 секунд. Из одной или нескольких фотографий (до 5) модель способна создавать видеоклипы, сохраняя визуальный контекст сцены.
Ключевая особенность модели состоит в редактировании видео через диалог на естественном языке без традиционных инструментов монтажа. При многошаговом редактировании система сохраняет персонажей, окружение и логику сцены между несколькими последовательными запросами. Дополнительно улучшено понимание физических закономерностей, включая гравитацию, кинетическую энергию и динамику жидкостей.
Gemini Omni Flash также позволяет создавать цифровые аватары на основе голоса и внешности пользователя, открывая возможность генерировать видео, внешне и по звучанию напоминающее самого автора. При этом Google намеренно отложила функцию редактирования чужой речи, сославшись на необходимость более глубокой проработки вопросов безопасности перед её выпуском.
Модель доступна подписчикам Google AI Plus, Pro и Ultra через приложение Gemini и платформу Google Flow, а для авторов YouTube Shorts и YouTube Create бесплатно. API для разработчиков появится в ближайшие недели. На этом же рынке ранее Luma AI выпустила модель Ray3 Modify для редактирования видео, ориентированную на профессиональных создателей контента.
Генерация видео с помощью искусственного интеллекта открывает новые возможности для создателей контента, особенно в сфере SMM, где востребованность коротких роликов продолжает расти. Бесплатный доступ для авторов YouTube Shorts снижает порог входа в производство видео и может изменить подходы к созданию брендового и пользовательского контента.