Постер Gemini Omni. Источник: Google На конференции Google I/O 2026 состоялся один из самых громких анонсов года в сфере искусственного интеллекта. Глава Google DeepMind Демис Хассабис (Demis Hassabis) представил Gemini Omni — принципиально новую мультимодальную модель, которая способна превращать абсолютно любой входящий формат данных в кинематографичное видео высокого качества. По словам Сундара Пичаи (Sundar Pichai), если раньше AI просто предсказывал текст, то с приходом Gemini Omni индустрия переходит к “симуляции реальности” благодаря продвинутому пониманию физики, истории и контекста нашего мира. Главная фишка Gemini Omni — концепция “любой input на входе — видео на выходе”. Нейросеть объединила в себе интеллект текстовых моделей Gemini с лучшими наработками Google в генерации медиа (включая видеогенератор Veo и игровую нейросеть Genie). Пользователь может загрузить в Omni одновременно несколько картинок из галереи, добавить аудиозапись, текстовый промт, существующий видеоролик — и нейросеть соберет из этого совершенно новый, реалистичный клип. Ключевые возможности новой модели: Важный аспект безопасности: все видеоролики, созданные с помощью Gemini Omni, будут маркироваться SynthID — невидимыми цифровыми водяными знаками Google. Это поможет верифицировать AI-контент и бороться с дипфейками. Первая версия модели под названием Gemini Omni Flash начинает разворачиваться уже сейчас. Она появится непосредственно в приложении Gemini, на YouTube Shorts, а также станет основой для мобильных приложений Google Flow (платформа для создания AI-фильмов) и Flow Music (для работы со звуком). Доступ к новинке первыми получат подписчики платных планов Google AI (Plus, Pro и Ultra). 
Что такое Gemini Omni и как это работает?
Когда и где можно протестировать?
Источник: Google
