OpenAI präsentiert Sora 2: KI-gestützte Video- und Audiogenerierung mit neuer iOS-App

Bearbeitet von: Veronika Radoslavskaya

OpenAI hat Sora 2 vorgestellt, die neueste Generation seiner KI-gestützten Modelle zur Video- und Audiogenerierung, zusammen mit einer neuen iOS-App. Dieses fortschrittliche System ermöglicht die Erstellung realistischer Videos mit synchronisierten Dialogen und Soundeffekten, die eine Länge von bis zu 16 Sekunden erreichen können, und stellt einen bedeutenden Fortschritt in der generativen KI dar. Sora 2 baut auf dem ursprünglichen Sora-Modell auf, das im Februar 2024 veröffentlicht wurde und bereits bahnbrechend war, aber Herausforderungen bei der Simulation komplexer physikalischer Interaktionen und der Aufrechterhaltung konsistenter Weltdarstellungen hatte. Sora 2 adressiert diese Einschränkungen und bietet verbesserte physikalische Genauigkeit, Realismus und Kontrollierbarkeit.

Die neue Sora-App, die derzeit nur für iOS-Geräte verfügbar ist, bietet eine vertikale Video-Feed-Oberfläche, die an Plattformen wie TikTok erinnert. Nutzer können Videos erstellen, bestehende Kreationen remixen und über die „Cameo“-Funktion sich selbst oder Freunde in generierte Szenen einfügen. Um personalisierte „Cameos“ zu ermöglichen, ist eine einmalige Video- und Audioaufnahme zur Identitätsprüfung und zur Erfassung der Ähnlichkeit erforderlich. OpenAI hat diese Funktion so konzipiert, dass die Nutzer die volle Kontrolle über ihre Ähnlichkeit behalten, einschließlich der Möglichkeit, die Nutzung jederzeit zu widerrufen.

OpenAI legt großen Wert auf Sicherheit und hat verschiedene Maßnahmen implementiert, um potenzielle Risiken zu mindern. Dazu gehören die Kennzeichnung von KI-generierten Inhalten durch sichtbare Wasserzeichen und unsichtbare Metadaten (C2PA-Standard) sowie interne Suchwerkzeuge zur Rückverfolgung von Videos. Darüber hinaus werden menschliche Moderatoren eingesetzt, um Inhalte auf Mobbing und andere schädliche Verhaltensweisen zu überprüfen. Für jüngere Nutzer gibt es spezielle Jugendschutzfunktionen, darunter elterliche Kontrollen über ChatGPT, die die Einstellungen für Direktnachrichten und die Personalisierung des Feeds steuern können.

Der Markt für KI-gestützte Videoerstellung wächst rasant. Prognosen gehen davon aus, dass er bis 2030 einen Wert von 36,4 Milliarden US-Dollar erreichen wird, mit einer durchschnittlichen jährlichen Wachstumsrate von 62,6 %. Sora 2 positioniert sich in diesem dynamischen Umfeld als wichtiger Akteur, der mit Konkurrenten wie Googles Veo 3 und Metas Vibes konkurriert. Die Integration von KI in die kreativen Industrien wird als Katalysator für Innovationen gesehen, wobei die Nachfrage nach visuell ansprechenden und personalisierten Inhalten steigt. Es wird erwartet, dass KI die Art und Weise, wie Inhalte erstellt und konsumiert werden, grundlegend verändern wird, wobei der Schwerpunkt auf der Steigerung menschlicher Kreativität und der Schaffung neuer Möglichkeiten liegt, anstatt menschliche Talente zu ersetzen.

Die Verfügbarkeit von Sora 2 beginnt mit einer schrittweisen Einführung in den USA und Kanada, wobei eine Expansion in weitere Länder geplant ist. Der Zugang ist zunächst auf Einladungen beschränkt, wobei bestehende ChatGPT-Nutzer priorisiert werden. OpenAI plant außerdem, Sora 2 über eine API für Entwickler zugänglich zu machen und erwägt, die Technologie in zukünftige Versionen von ChatGPT zu integrieren.

Quellen

  • NBC News

  • OpenAI Releases Sora 2: Advanced AI Video and Audio Generation App

  • OpenAI Is Preparing to Launch a Social App for AI-Generated Videos

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?

Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.