Google hat auf seiner jährlichen Google I/O-Veranstaltung in Mountain View, USA, Veo 3 vorgestellt, ein fortschrittliches KI-Modell, das Videos aus Text generieren kann. Diese neue Version interpretiert von Nutzern verfasste Kurzgeschichten und wandelt sie in Clips mit Animationen, Gesichtsausdrücken und in die Erzählung integriertem Audio um. Veo 3 beinhaltet synchronisiertes Audio mit Bildern, wie z. B. Dialoge zwischen Charakteren, Umgebungsgeräusche und Soundeffekte. Dies stellt einen bedeutenden Fortschritt gegenüber seinem Vorgänger dar, mit der Fähigkeit, komplexe Beschreibungen zu verstehen und in realistische Szenen mit detaillierter Physik, natürlichen Bewegungen und Umgebungsgeräuschen umzuwandeln. Veo 3 wurde in Zusammenarbeit mit Film-, Musik- und Bildkunstexperten entwickelt und integriert die SynthID-Technologie, um KI-generierte Inhalte digital zu kennzeichnen und Fehlinformationen zu verhindern. Veo 3 ist derzeit in den Vereinigten Staaten über die Gemini-Anwendung für Ultra-Abonnenten und für Unternehmen über Vertex AI verfügbar. Es kann auch auf Flow verwendet werden, Googles neuer Plattform für KI-gestützte Filmproduktion.
Google stellt Veo 3 vor: KI-Modell generiert Videos mit synchronisiertem Audio
Bearbeitet von: Veronika Nazarova
Quellen
Visão
Weitere Nachrichten zu diesem Thema lesen:
Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?
Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.