Gemini Omni: нова мультимодальна модель Google

20.05.2026 06:18 · 2 хв читання

Google представила **Gemini Omni** — нову модель, яка об'єднує відео, аудіо та текст у звичайному діалозі. Завдяки **Omni Flash** користувачі можуть генерувати й редагувати відео просто розмовляючи з AI, змінюючи стиль, фон, персонажів та багато іншого всього однією командою. Також оновлено відеоредактор **Google Flow** з інтеграцією Gemini Omni, творчим помічником **Flow Agent** та інструментами для створення власних ефектів. Нова модель доступна підписникам Google AI Plus, Pro та Ultra.

Gemini Omni: нова модель від Google об'єднує відео, аудіо та текст у звичайному діалозі

На конференції Google I/O 2026 компанія представила Gemini Omni — нову серію моделей, що поєднує інтелект Gemini з розширеними генеративними можливостями для роботи з медіа. Перша модель цієї серії, Omni Flash, вже доступна та замінює Veo 3.1 у додатку Gemini.

Головна особливість нової технології — можливість генерувати та редагувати відео через звичайну розмову. Замість складних інструментів та налаштувань користувачі можуть просто пояснити моделі, що саме і як потрібно змінити.

Ключові можливості Gemini Omni Flash

Обробка будь-якої комбінації тексту, зображень, аудіо та відео
Генерація та редагування відео на основі реальних знань моделі
Вставка себе у відео або анімоване фото
Зміна стилю відео (реалістичний, мультиплікаційний, аніме)
Інтеграція персонажів у картини епохи Ренесансу
Редагування фону, одягу, освітлення однією командою
Додавання нових персонажів або об'єктів зі збереженням фізики сцени

Модель запам'ятовує контекст усіх попередніх змін, що дозволяє послідовно вдосконалювати результат. Усі згенеровані відео автоматично отримують невидимий водяний знак SynthID. Доступ до Omni відкритий для підписників AI Plus, Pro та Ultra через додаток Gemini, Google Flow та YouTube Shorts.

Оновлення екосистеми Google Flow

Google оновила свій відеоредактор Google Flow, анонсований на I/O 2025. Тепер він підтримує інтеграцію реальних зйомок із згенерованим контентом завдяки Gemini Omni, а також забезпечує кращу послідовність персонажів між сценами.

Серед нових функцій:

Google Flow Agent — творчий помічник для брейнстормінгу, планування та пакетного редагування
Flow Tools — інструменти для створення власних ефектів та шейдерів без знання програмування з можливістю ділитися ними з іншими користувачами

Також оновлено Google Flow Music (раніше відомий як ProducerAI). Тепер він дозволяє створювати музичні кліпи за допомогою голосових команд, визначаючи стиль, персонажів та сцени для відео до власних треків.

Обидва застосунки тепер доступні на мобільних платформах: Flow вийшов у бета-версії для Android (iOS — найближчим часом), а Flow Music спочатку з'явився на iOS (Android — незабаром).

Еволюція технологій генерації відео

Як зазначалося раніше, Veo 3.1 став доступним в Україні у липні 2025 року для підписників Google AI Pro. Він запровадив відеогенерацію зі звуком, синхронізацію діалогів та кінематографічні стилі. Gemini Omni робить наступний крок — об'єднує різні медіаформати в єдину мультимодальну систему, де межа між генерацією та редагуванням практично зникає.

Джерело: Google

Джерело: itc.ua

Читайте також

Gemini Omni: нова мультимодальна модель Google

Gemini Omni: нова модель від Google об'єднує відео, аудіо та текст у звичайному діалозі

Ключові можливості Gemini Omni Flash

Оновлення екосистеми Google Flow

Еволюція технологій генерації відео

Читайте також

Gemini Spark: новий ШІ-агент від Google працює за вас 24/7

Gemini 3.5 Flash обійшла флагмана за продуктивністю

Google представляє Android XR - розумні окуляри майбутнього.