Google улучшил видеогенерацию: Veo 3.1 и обновленный Flow с расширенным контролем и синхронизацией аудио

19:37, 15 октября

Отредактировано: Veronika Radoslavskaya

Сфера создания цифрового контента переживает глубокую трансформацию благодаря корпорации Google, которая представила свою новейшую модель для генерации видео на основе искусственного интеллекта — Veo 3.1. Одновременно были анонсированы значительные улучшения в интегрированном пакете инструментов для кинопроизводства Flow. Эта эволюция знаменует собой существенную перенастройку творческих инструментов, предоставляя визуальным рассказчикам возможность воплощать сложные замыслы с большей точностью и контролем, чем когда-либо прежде. Основной акцент в анонсе сделан на достижении улучшенного реализма, сложных возможностях синхронизированного звука и более глубокого, интуитивного понимания повествовательной структуры в рамках ИИ-системы.

Veo 3.1 является развитием базовой модели Veo 3, впервые продемонстрированной в мае 2025 года. Новая итерация значительно улучшает визуальный результат за счет превосходного рендеринга текстур и более тонкой проработки освещения окружающей среды, что приближает технологию к фотореалистичности. Критически важно, что теперь модель демонстрирует выдающиеся успехи в генерации аудио, гарантируя, что звуковые эффекты и диалоги идеально синхронизированы с визуальным действием. Это решает проблему нарушения погружения, характерную для многих ранних генеративных систем. ИИ также демонстрирует более глубокое осмысление кинематографического языка, позволяя ему точнее следовать конкретным стилистическим запросам. Для пользователей также доступна быстрая версия модели — Veo 3.1 Fast.

Эта возросшая генеративная мощь напрямую реализуется через обновленный инструмент Flow, с помощью которого с момента его запуска было создано более 275 миллионов видеороликов. Теперь в распоряжении авторов находится набор мощных новых функций, призванных оптимизировать сложные производственные задачи. Функция под названием 'Ingredients to Video' (Ингредиенты для видео) позволяет загружать несколько эталонных изображений, обеспечивая единообразие дизайна персонажей и общей визуальной эстетики на протяжении всей сцены, теперь уже с соответствующим звуковым сопровождением. Для более амбициозных повествований предусмотрена функция 'Scene Extension' (Расширение сцены), которая позволяет удлинять сгенерированные клипы, преодолевая прежние ограничения короткого формата при сохранении непрерывности аудиоряда.

Инструментарий Flow также предлагает новые формы управления, например, 'Frames to Video' (Кадры в видео), которая создает плавное движение между двумя заданными пользователем статичными изображениями, также дополненное синхронизированным звуком. Кроме того, инструменты для манипулирования объектами позволяют вставлять или удалять элементы внутри сцены. При этом система интеллектуально пересчитывает и применяет реалистичные тени и освещение. Эти возможности, включая вставку и удаление объектов, призваны переосмыслить творческий рабочий процесс как для индивидуальных авторов, так и для разработчиков и корпоративных пользователей, получающих доступ к технологии через платформы Gemini API и Vertex AI.

Этот технологический скачок подчеркивает стремление Google к демократизации высококачественного, поддерживаемого ИИ видеопроизводства, передавая сложные средства контроля непосредственно в руки визионеров. Сосредоточенность на решении сложных проблем визуальной непрерывности, таких как поддержание согласованного освещения при вставке объектов, свидетельствует о понимании тонких элементов, которые превращают симуляцию в убедительное искусство. Анализ индустрии показал, что модели, достигающие высокой временной согласованности, пользуются повышенным спросом среди профессиональных студий. Таким образом, акцент Veo 3.1 на постоянстве объектов и расширении сцены является крайне актуальным для профессионального творческого сообщества.

Источники

Beebom
9to5Google
Google Developers Blog
TechCrunch
BGR
Google Cloud Blog

Читайте больше новостей по этой теме:

17 октября

Windows 11: Microsoft превращает ПК в интеллектуального ассистента с Copilot

15 октября

Быстрее, дешевле, умнее: Anthropic запускает Claude Haiku 4.5 для массового использования

14 октября

Microsoft представляет MAI-Image-1: стратегический шаг к независимости в сфере генеративного ИИ

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.

Центр уведомлений

Центр уведомлений

Google улучшил видеогенерацию: Veo 3.1 и обновленный Flow с расширенным контролем и синхронизацией аудио

Источники

Читайте больше новостей по этой теме: