Google DeepMind optimiert Veo 3.1: Einführung professioneller Steuerungsoptionen und nativer Unterstützung für vertikale Videos
Bearbeitet von: Veronika Radoslavskaya
Am 13. Januar 2026 verkündete Google DeepMind ein umfassendes Funktions-Update für sein wegweisendes Videogenerierungsmodell Veo 3.1. Im Zentrum dieser Aktualisierung steht das innovative Toolset „Ingredients to Video“, welches speziell darauf ausgelegt ist, Content-Erstellern eine Präzision auf professionellem Niveau zu bieten. Diese technologische Weiterentwicklung markiert einen bedeutenden Fortschritt bei der Transformation von statischen Referenzbildern in hochauflösende, filmische Sequenzen mit beeindruckender Dynamik.
Um den Anforderungen der modernen, mobil-zentrierten Medienlandschaft gerecht zu werden, wurde Veo 3.1 gezielt für das Smartphone-Zeitalter optimiert. Die Einführung einer nativen Unterstützung für das vertikale 9:16-Format erlaubt es Produzenten nun, hochwertige Vollbild-Inhalte direkt für Plattformen wie YouTube Shorts zu generieren. In einer Ära, in der vertikale Videoformate den digitalen Konsum dominieren, eliminiert diese Funktion die Notwendigkeit für nachträgliches Zuschneiden, was in der Vergangenheit oft zu einem erheblichen Verlust an Bildauflösung und Detailtiefe führte.
Parallel dazu hat Google ein fortschrittliches System für das 4K-Upscaling implementiert, um den strengen Qualitätsstandards professioneller Filmproduktionen zu entsprechen. Diese Funktion verbessert Texturen und feinste visuelle Details in den generierten Clips signifikant. Dadurch eignen sich die KI-erzeugten Videos nicht nur für soziale Medien, sondern auch für anspruchsvolle professionelle Workflows und die Darstellung auf großformatigen Bildschirmen, wobei die visuelle Brillanz stets gewahrt bleibt.
Das eigentliche Herzstück des Updates ist jedoch die Weiterentwicklung des „Ingredients“-Systems, das einen technologischen Durchbruch in Bezug auf die Identitäts- und Stil-Konsistenz darstellt. Das erweiterte Framework bietet nun eine Reihe von Funktionen, die die kreative Kontrolle auf eine völlig neue Stufe heben und Regisseuren präzisere Werkzeuge an die Hand geben:
- Dreifach-Bildreferenzierung: Nutzer können bis zu drei verschiedene Referenzbilder – beispielsweise einen spezifischen Charakter, eine definierte Umgebung und einen gewünschten visuellen Stil – als Grundlage für eine einzige Generierung verwenden. Dies garantiert, dass die Identität einer Figur über verschiedene Szenen und Einstellungen hinweg absolut stabil und wiedererkennbar bleibt.
- Kontrolle über Start- und Endframes: Eine mächtige neue Funktion erlaubt es, den exakten Anfangs- und Endpunkt eines Videos festzulegen. Veo 3.1 generiert daraufhin einen nahtlosen, filmischen Übergang zwischen diesen beiden Fixpunkten, wobei die visuelle Logik und die Kontinuität der Bewegung während des gesamten Clips gewahrt bleiben.
- Szenenerweiterung: Um die Erstellung längerer Erzählungen zu vereinfachen, kann das Modell nun Videos verlängern, indem es neue Segmente generiert, die nahtlos an die finalen Frames eines vorangegangenen Clips anknüpfen. Dies stellt sicher, dass sowohl die visuelle Ästhetik als auch die Dynamik der Bewegungen über längere Zeiträume hinweg konsistent wirken.
In puncto Regieanweisungen zeigt sich Veo 3.1 nun deutlich intelligenter und interpretiert professionelle kinematografische Befehle mit einer wesentlich höheren Genauigkeit. Anweisungen wie „Dolly-In“, „Pan“ (Schwenk) oder spezifische „filmische Beleuchtung“ werden präzise umgesetzt, was den generierten Videos eine Dynamik verleiht, die man sonst nur von physischen Kamera-Rigs kennt.
Ein weiterer Meilenstein ist die Integration von vollständig synchronisiertem Audio. Veo 3.1 generiert nun passend zum Bildmaterial atmosphärische Umgebungsgeräusche und Soundeffekte (SFX). Besonders hervorzuheben ist die experimentelle Funktion zum Lip-Syncing, bei der die Lippenbewegungen von Charakteren präzise mit dem Ton synchronisiert werden, was zu einem weitaus immersiveren und kohärenteren Gesamterlebnis für den Zuschauer führt.
Die Verfügbarkeit dieser neuen Funktionen ist breit gefächert, da Google sie tief in sein bestehendes Ökosystem integriert. Ab sofort stehen die Werkzeuge in der Gemini-App sowie auf der spezialisierten Filmmaking-Plattform Flow zur Verfügung. Für Unternehmenskunden und Entwickler werden die Funktionen zudem über die Gemini-API und innerhalb der Vertex AI-Umgebung zugänglich gemacht, um professionelle KI-gestützte Videoproduktion in großem Maßstab zu ermöglichen.
Abschließend legt Google großen Wert auf Sicherheit und die eindeutige Kennzeichnung von KI-Inhalten. Alle durch Veo 3.1 erzeugten Videos enthalten digitale SynthID-Wasserzeichen, die technisch nachweisbar sind. In einer Zeit, in der die Unterscheidung zwischen Realität und KI-generierten Inhalten immer wichtiger wird, können Nutzer die Herkunft eines Videos verifizieren, indem sie es in die Gemini-App hochladen, um prüfen zu lassen, ob es mithilfe der KI-Technologien von Google erstellt wurde.
50 Ansichten
Quellen
Digital Trends Español
Techmeme
Veo 3.1 Ingredients to Video: More consistency, creativity and control
Google Announces Veo 3.1 and New Flow Capabilities - Thurrott.com
Google DeepMind
The Best AI Video Generators in 2026: Tested, Reviewed & Ranked - by Jim Clyde Monge
Weitere Nachrichten zu diesem Thema lesen:
Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.
