Google презентує модель Veo 3.1 для ШІ-відео з інструментами Flow нового покоління та насиченішим звуком

19:37, 15 жовтня

Відредаговано: Veronika Radoslavskaya

Сфера створення цифрового контенту переживає значну трансформацію після того, як компанія Google представила свою новітню модель генерації відео на основі штучного інтелекту — Veo 3.1, а також суттєво оновила свій інтегрований пакет інструментів для кіновиробництва Flow. Ця еволюція являє собою кардинальне переосмислення творчих інструментів, надаючи візуальним оповідачам можливість втілювати складні задуми з більшою точністю та контролем, ніж це було можливо раніше. Основний акцент оголошення зроблено на забезпеченні підвищеного реалізму, складних можливостей синхронізованого звуку та глибшого, більш інтуїтивного розуміння наративної структури в рамках ШІ-системи.

Veo 3.1 розроблена на основі моделі Veo 3, яка була вперше представлена у травні 2025 року. Нова ітерація вдосконалює візуальний результат завдяки кращому відтворенню текстур та більш тонкому налаштуванню освітлення навколишнього середовища, максимально наближаючи технологію до фотореалізму. Вирішальне значення має те, що тепер модель чудово справляється з просунутою генерацією аудіо, гарантуючи, що звукові ефекти та діалоги будуть детально синхронізовані з візуальною дією. Це вирішує поширену проблему порушення занурення, яка була притаманна попереднім генеративним системам. Штучний інтелект також демонструє глибше розуміння кінематографічної мови, що дозволяє йому точніше дотримуватися конкретних стилістичних запитів. Для користувачів також доступна швидка версія моделі Veo 3.1 Fast.

Ця розширена генеративна потужність безпосередньо спрямовується через оновлений інструмент для кіновиробництва Flow, за допомогою якого з моменту його впровадження було створено понад 275 мільйонів відеороликів. Тепер творці мають у своєму розпорядженні набір потужних нових функцій, розроблених для оптимізації складних виробничих завдань. Функція під назвою «Інгредієнти у Відео» (Ingredients to Video) дозволяє користувачам завантажувати кілька еталонних зображень, встановлюючи послідовний дизайн персонажів та візуальну естетику для всієї сцени, тепер із відповідним звуковим супроводом. Для амбітних наративів функція «Розширення Сцени» (Scene Extension) дозволяє подовжувати згенеровані кліпи, що нівелює попередні обмеження короткого формату, зберігаючи при цьому безперервність аудіо.

Крім того, інструмент Flow пропонує інноваційні форми контролю. Наприклад, «Кадри у Відео» (Frames to Video) генерує плавний рух між двома визначеними користувачем статичними зображеннями, доповнюючи їх синхронізованим звуком. Більше того, інструменти для маніпуляції об’єктами дають змогу вставляти або видаляти елементи в межах сцени, при цьому система інтелектуально перераховує та застосовує реалістичні тіні та освітлення. Ці можливості, включаючи вставку та видалення об’єктів, покликані переосмислити творчий робочий процес для розробників та корпоративних користувачів, які отримують доступ до технології через платформи Gemini API та Vertex AI, а також для індивідуальних творців.

Цей технологічний стрибок підкреслює прагнення Google до демократизації високоякісного відеовиробництва за допомогою ШІ, передаючи складні механізми контролю безпосередньо в руки візіонерів. Зосередженість на вирішенні складних проблем візуальної безперервності, таких як збереження послідовного освітлення під час вставки об’єктів, свідчить про розуміння тонких елементів, які перетворюють симуляцію на переконливе мистецтво. Галузевий аналіз показав, що моделі, які досягають високої часової узгодженості (temporal consistency), користуються підвищеним попитом серед професійних студій. Таким чином, акцент Veo 3.1 на стійкості об’єктів (object persistence) та розширенні сцени є надзвичайно актуальним для професійної творчої спільноти.

30 Перегляди

Джерела

Beebom
9to5Google
Google Developers Blog
TechCrunch
BGR
Google Cloud Blog

Читайте більше новин на цю тему:

06 грудня

Kling Video O1: Перша у світі універсальна модель для генерації та текстового редагування відео

06 грудня

Філософ штучного інтелекту: Як Anthropic навчає Клода розрізняти добро і зло

03 грудня

OpenAI розробляє «Garlic»: Спеціалізовану модель, що демонструє флагманську продуктивність при оптимізованому масштабуванні

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.

Центр сповіщень

Центр сповіщень

Google презентує модель Veo 3.1 для ШІ-відео з інструментами Flow нового покоління та насиченішим звуком

Джерела

Читайте більше новин на цю тему: