⚡ Терміново
UkrPulse
Штучний інтелект

Google випустила Gemini 3.5 Live Translate

· 2 хв читання
Google випустила Gemini 3.5 Live Translate
Google представила революційну модель **Gemini 3.5 Live Translate**, яка забезпечує переклад мовлення в реальному часі з природністю оригінального голосу, підтримуючи понад 70 мов. Нова технологія доступна у Google Translate, Google Meet та для розробників, а для безпеки використовується водяний знак SynthID.

Google представила Gemini 3.5 Live Translate — прорив у перекладі мовлення в реальному часі

Компанія Google анонсувала нову модель Gemini 3.5 Live Translate, яка забезпечує переклад мовлення в реальному часі з безпрецедентною природністю. Система підтримує понад 70 мов і відтворює не лише зміст, а й тон, темп та інтонацію оригінального голосу.

Як працює технологія

На відміну від традиційних систем, які перекладають фрази лише після завершення висловлювання, Gemini 3.5 Live Translate генерує мовлення безперервно. Це дозволяє уникнути незручних пауз і забезпечує плавний аудіопотік, відстаючи від мовця лише на кілька секунд.

Як зазначають у Google, модель постійно балансує між двома завданнями:

  • очікуванням достатнього контексту для точного перекладу;
  • миттєвою генерацією мовлення, щоб залишатися синхронізованою зі співрозмовником.

Де доступна нова функція

Оновлення вже почало розгортатися в Google Translate для Android та iOS. Щоб скористатися перекладом у реальному часі, достатньо:

  • підключити навушники;
  • натиснути кнопку "Live translate" у нижньому лівому куті екрана.

Для користувачів Android також з’явився режим прослуховування, який дозволяє чути переклад через динамік телефону. Функція особливо зручна, коли навушників немає під рукою — достатньо піднести пристрій до вуха, як під час звичайного дзвінка.

Інтеграція з Google Meet

Раніше переклад у Google Meet підтримував лише п’ять мов, обмежуючи можливості спілкування англійською. Тепер, завдяки Gemini 3.5 Live Translate, кількість мовних комбінацій перевищує 2000, що відкриває нові горизонти для міжнародних відеоконференцій.

У вебверсії Google Meet з’явилася окрема кнопка для запуску перекладу мовлення, розташована в панелі керування. Функція вже тестується серед бізнес-клієнтів Google Workspace у закритому попередньому перегляді, а повноцінний запуск очікується пізніше цього року.

Доступ для розробників та безпека

Модель також доступна в публічному попередньому перегляді для розробників через Gemini Live API та Google AI Studio. Це дозволяє інтегрувати технологію в різноманітні сценарії:

  • багатомовні дзвінки;
  • онлайн-уроки;
  • прямі трансляції;
  • міжнародні конференції.

Для забезпечення безпеки весь згенерований аудіоконтент маркується за допомогою технології SynthID. Цей непомітний водяний знак вплітається в аудіофайли, дозволяючи виявляти контент, створений штучним інтелектом, і запобігати поширенню дезінформації.

Переваги для реального використання

Окрім широкої мовної підтримки, Gemini 3.5 Live Translate вирізняється низкою практичних переваг:

  • Автоматичне визначення мови співрозмовника без додаткових налаштувань.
  • Стабільна робота в шумних умовах, що робить технологію придатною для використання на вулиці, у транспорті чи на масових заходах.
  • Збереження природності мовлення, включаючи емоційне забарвлення та індивідуальні особливості голосу.

Нова модель відкриває широкі можливості для глобальної комунікації, роблячи спілкування між людьми різних мовних груп простішим і природнішим.

Джерело: itc.ua