Google präsentiert Veo 3.1: KI-Videomodell der nächsten Generation mit erweiterter Flow-Toolbox und synchronisiertem Audio

19:37, 15 Oktober

Bearbeitet von: Veronika Radoslavskaya

Die digitale Inhaltserstellung erlebt eine tiefgreifende Wende, ausgelöst durch die Einführung von Googles neuestem Modell zur künstlichen Videoerzeugung, Veo 3.1. Begleitet wird dieses Update von signifikanten Verbesserungen der integrierten Filmsuite Flow. Diese Entwicklung stellt eine wesentliche Neukalibrierung kreativer Werkzeuge dar und ermöglicht es visuellen Geschichtenerzählern, komplexe Ideen mit einer bisher unerreichten Präzision und Kontrolle umzusetzen. Im Zentrum der Ankündigung stehen die Bereitstellung von gesteigertem Realismus, hochentwickelten synchronisierten Audiofunktionen und einem tieferen, intuitiveren Verständnis für narrative Strukturen innerhalb des KI-Frameworks.

Veo 3.1 baut auf dem Fundament des ursprünglichen Veo 3-Modells auf, das erstmals im Mai 2025 vorgestellt wurde. Die aktuelle Iteration verfeinert die visuelle Ausgabe durch überlegene Texturwiedergabe und nuanciertere Umgebungsbeleuchtung, wodurch die Technologie dem Fotorealismus einen großen Schritt näherkommt. Entscheidend ist, dass das Modell nun herausragende Leistungen bei der erweiterten Audiogenerierung erbringt. Es stellt sicher, dass Soundeffekte und Dialoge akribisch mit der visuellen Handlung synchronisiert werden – ein Mangel, der in früheren generativen Systemen häufig das Eintauchen in die Szene störte. Darüber hinaus zeigt die KI ein ausgeprägteres Verständnis der filmischen Sprache, was eine engere Einhaltung spezifischer stilistischer Vorgaben ermöglicht. Für Nutzer steht auch eine Veo 3.1 Fast-Version zur Verfügung.

Diese gesteigerte generative Leistung wird direkt über das aktualisierte Flow-Filmerstellungswerkzeug kanalisiert, mit dem seit seiner Einführung bereits über 275 Millionen Videos erstellt wurden. Kreative haben nun Zugriff auf eine Reihe leistungsstarker neuer Funktionen, die darauf abzielen, komplexe Produktionsaufgaben zu optimieren. Die Funktion „Ingredients to Video“ (Zutaten zum Video) erlaubt es Anwendern, mehrere Referenzbilder einzugeben, um konsistente Charakterdesigns und visuelle Ästhetiken über eine gesamte Sequenz hinweg zu gewährleisten, nun ergänzt durch passendes Audio. Für ambitioniertere Erzählungen ermöglicht die Funktion „Scene Extension“ (Szenenerweiterung) die Verlängerung generierter Clips, wodurch frühere Beschränkungen der Kurzform überwunden werden, während die Audiokontinuität gewahrt bleibt.

Das Flow-Tool führt auch neuartige Kontrollmechanismen ein, wie etwa „Frames to Video“ (Bilder zum Video), das eine nahtlose Bewegung zwischen zwei vom Benutzer definierten Standbildern erzeugt, komplett mit synchronisiertem Ton. Darüber hinaus ermöglichen Werkzeuge zur Objektmanipulation das Einfügen oder Entfernen von Elementen innerhalb einer Szene. Das System berechnet dabei intelligent realistische Schatten und Beleuchtung neu und wendet sie an. Diese Fähigkeiten, einschließlich der Objektinsertion und -entfernung, sind dazu bestimmt, den kreativen Workflow für Entwickler und Unternehmenskunden, die über die Gemini API und Vertex AI Plattformen auf die Technologie zugreifen, sowie für individuelle Schöpfer neu zu definieren.

Dieser technologische Sprung unterstreicht Googles Bestreben, die hochauflösende, KI-gestützte Videoproduktion zu demokratisieren, indem es hochentwickelte Steuerungsmöglichkeiten direkt in die Hände von Visionären legt. Der Fokus auf die Lösung komplizierter Probleme der visuellen Kontinuität, wie die Beibehaltung einer konsistenten Beleuchtung beim Einfügen von Objekten, deutet auf ein tiefes Verständnis jener subtilen Elemente hin, die eine Simulation zu fesselnder Kunst erheben. Branchenanalysen haben gezeigt, dass Modelle, die eine hohe zeitliche Konsistenz erreichen, bei professionellen Studios hohe Akzeptanzraten erzielen. Dies positioniert Veo 3.1s Schwerpunkt auf Objektpersistenz und Szenenerweiterung als äußerst relevant für die professionelle Kreativgemeinschaft.

Quellen

Beebom
9to5Google
Google Developers Blog
TechCrunch
BGR
Google Cloud Blog

Weitere Nachrichten zu diesem Thema lesen:

17 Oktober

Windows 11: Microsoft verwandelt den PC in einen intelligenten Assistenten mithilfe von Copilot

15 Oktober

Anthropic’s Claude Haiku 4.5 löst KI-Preissturz aus und demokratisiert Near-Frontier-Leistung

14 Oktober

Microsoft setzt auf Eigenentwicklung: MAI-Image-1 markiert Unabhängigkeit in der generativen KI

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.

Benachrichtigungszentrum

Benachrichtigungszentrum

Google präsentiert Veo 3.1: KI-Videomodell der nächsten Generation mit erweiterter Flow-Toolbox und synchronisiertem Audio

Quellen

Weitere Nachrichten zu diesem Thema lesen: