Google DeepMind удосконалює Veo 3.1: впровадження професійних інструментів контролю та нативної підтримки вертикального відео

20:43, 13 січня

Відредаговано: Veronika Radoslavskaya

iframe { display: none; }

Google DeepMind удосконалює Veo 3.1: впровадження професійних інструментів контролю та нативної підтримки вертикального відео

13 січня 2026 року технологічний підрозділ Google DeepMind офіційно представив масштабне оновлення своєї передової моделі генерації відео Veo 3.1. Ключовим елементом цього релізу став інноваційний набір інструментів під назвою «Ingredients to Video», розроблений для того, щоб надати професійним творцям контенту безпрецедентну точність при перетворенні статичних референсних зображень на динамічні кінематографічні сцени високої якості.

iframe { display: none; }

Орієнтуючись на потреби сучасної епохи мобільних медіа, розробники впровадили в Veo 3.1 повну нативну підтримку вертикального формату зі співвідношенням сторін 9:16. Ця інновація дозволяє авторам створювати високоякісний повноекранний контент безпосередньо для таких популярних платформ, як YouTube Shorts. Такий підхід допомагає уникнути деградації зображення та втрати роздільної здатності, які неминуче виникають при традиційному обрізанні стандартних горизонтальних кадрів під вертикальні екрани.

iframe { display: none; }

Для забезпечення відповідності найсуворішим стандартам професійного кіновиробництва, Google також реалізувала вдосконалену технологію інтелектуального масштабування до роздільної здатності 4K. Ця функція значно покращує деталізацію текстур, глибину кольорів та чіткість найдрібніших елементів, роблячи відеоматеріали, згенеровані штучним інтелектом, повністю придатними для професійних робочих процесів, монтажу та демонстрації на екранах великого формату.

iframe { display: none; }

Фундаментальним проривом в оновленні стала система «Ingredients to Video», яка забезпечує винятковий рівень контролю над візуальною ідентичністю та стилістичною цілісністю проектів. Оновлена архітектура моделі тепер пропонує розширені можливості для творчості, що дозволяють зберігати стабільність візуального ряду протягом усієї генерації:

iframe { display: none; }

Потрійне посилання на зображення: тепер користувачі можуть надавати до трьох референсних картинок одночасно — наприклад, окремо для персонажа, навколишнього середовища та специфічного візуального стилю. Це гарантує, що штучний інтелект точно зберігатиме зовнішність героя та атмосферу сцени в різних ракурсах.
Контроль першого та останнього кадрів: ця потужна функція дозволяє режисерам чітко визначати початкову та кінцеву точки відеоролика. Veo 3.1 самостійно створює безшовний кінематографічний перехід між цими двома зображеннями, суворо дотримуючись візуальної логіки та динаміки руху.
Інтелектуальне розширення сцени: для полегшення створення тривалих наративів модель тепер здатна подовжувати існуючі відео, генеруючи нові сегменти на основі фінальних кадрів попереднього кліпу, що забезпечує ідеальну безперервність сюжету та візуального стилю.

Оновлена модель Veo 3.1 демонструє глибоке розуміння професійної кінематографічної мови та термінології. Вона з високою точністю інтерпретує складні операторські команди, такі як «dolly-in» (наїзд камери), «pan» (панорамування) або «cinematic lighting» (кінематографічне освітлення). Це дозволяє авторам керувати віртуальною камерою та світловими схемами на рівні досвідчених постановників, досягаючи вражаючих художніх результатів.

iframe { display: none; }

Важливою частиною оновлення стала повна інтеграція синхронізованого звукового супроводу. Модель Veo 3.1 тепер здатна автоматично генерувати не лише фонові шуми та складні звукові ефекти (SFX), а й експериментальну технологію синхронізації губ (lip-sync) для персонажів. Це створює цілісний імерсивний досвід, де візуальний ряд та аудіо доповнюють одне одного, формуючи завершений медіапродукт.

Нові можливості моделі Veo 3.1 активно впроваджуються в усю технологічну екосистему Google. Вони вже стають доступними для широкого кола користувачів у додатку Gemini, а також на спеціалізованій платформі для кіновиробництва Flow. Для корпоративних клієнтів та розробників доступ забезпечується через Gemini API та професійний інструментарій Vertex AI, що дозволяє інтегрувати потужність ШІ у власні бізнес-процеси.

З метою забезпечення максимальної прозорості та дотримання етичних стандартів у сфері штучного інтелекту, увесь контент, створений за допомогою Veo 3.1, містить вбудовані цифрові водяні знаки SynthID. Ці невидимі мітки дозволяють надійно ідентифікувати походження відео навіть після його подальшого редагування або стиснення, що є критично важливим для верифікації цифрового контенту.

Крім того, Google надає користувачам зручний інструмент для перевірки автентичності: тепер кожен може з'ясувати походження відеофайлу, просто завантаживши його в додаток Gemini. Система миттєво проведе аналіз та підтвердить, чи було відео створене за допомогою інструментів штучного інтелекту компанії, що сприяє формуванню безпечного та прозорого цифрового середовища.

82 Перегляди

Джерела

Digital Trends Español
Techmeme
Veo 3.1 Ingredients to Video: More consistency, creativity and control
Google Announces Veo 3.1 and New Flow Capabilities - Thurrott.com
Google DeepMind
The Best AI Video Generators in 2026: Tested, Reviewed & Ranked - by Jim Clyde Monge

Читайте більше статей на цю тему:

09 квітня

Проти Grammarly подали позов про порушення права на публічність через ШІ-редактор стилів

06 квітня

Microsoft випускає три власні базові моделі ШІ, кидаючи виклик OpenAI та Google

06 квітня

Microsoft та Google уклали багаторічні угоди з SK Hynix на постачання AI DRAM з 2026 року

Знайшли помилку чи неточність?Ми розглянемо ваші коментарі якомога швидше.