Google представила Veo 3.1: Новый этап в генерации видео и восприятии цифровой реальности

Отредактировано: gaya ❤️ one

В 2025 году компания Google анонсировала свою новейшую разработку в сфере искусственного интеллекта — модель генерации видео Veo 3.1. Этот инструмент способен создавать видеоматериалы высокого разрешения, основываясь на текстовых и визуальных инструкциях. Он демонстрирует значительные успехи в синхронизации звукового сопровождения, диалогов и соответствующих звуковых эффектов, что знаменует собой качественный прорыв в синтезе медиаконтента.

Ключевым показателем возросшей мощности Veo 3.1 стало успешное прохождение так называемого «теста Уилла Смита, поедающего спагетти». Этот сценарий, ставший неофициальным эталоном для оценки реализма ИИ-видео, ранее выявлял серьезные недостатки в имитации мимики и сложных человеческих движений. В отличие от ранних версий, где актер выглядел неестественно, Veo 3.1 теперь воспроизводит тонкие детали, включая выражение лица и даже звуки приема пищи, с высокой степенью точности.

Несмотря на очевидный прогресс, позволяющий создавать клипы, неотличимые от реальной съемки при беглом просмотре, остаются области для дальнейшего совершенствования. Некоторые пользователи отмечают, что звуковые эффекты, в частности хруст при жевании, все еще кажутся несколько искусственными. Этот факт подчеркивает, что даже самые передовые инструменты являются отражением обучающих данных и требуют постоянной калибровки для достижения полной гармонии с наблюдаемой реальностью.

В ответ на растущие возможности генеративного ИИ Google внедряет меры для обеспечения прозрачности контента. В материалы, созданные с помощью Veo, будут встраиваться невидимые водяные знаки SynthID, а также добавляться специальная маркировка «Veo». Технология SynthID, разработанная Google DeepMind, встраивает цифровые метки непосредственно в пиксели видео, делая их невоспринимаемыми для человеческого глаза, но обнаруживаемыми специальными инструментами. Это стремление к маркировке является важным шагом в направлении ответственного использования технологий.

Достижение Veo 3.1 ставит его в один ряд с такими передовыми моделями, как Sora от OpenAI. Этот прорыв открывает перед создателями контента беспрецедентные возможности для воплощения смелых идей, одновременно требуя от общества осознанного подхода к потреблению и распространению информации. Это событие служит катализатором для переоценки того, как мы воспринимаем увиденное, и для укрепления нашей способности различать суть за внешними проявлениями.

Источники

  • Webtekno

  • PetaPixel

  • South China Morning Post

  • Quartz

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.