Google enthüllt Lyria 3: KI-Musikstudio direkt in Gemini integriert

Autor: Veronika Radoslavskaya

Am 18. Februar 2026 verkündete Google DeepMind den weltweiten Start von Lyria 3, dem bisher fortschrittlichsten Modell des Unternehmens zur Generierung von Musik. Was ursprünglich als reine Forschungs-Vorschau begann, wurde nun für Nutzer auf der ganzen Welt zugänglich gemacht. Die Integration erfolgt direkt über die Gemini-Weboberfläche sowie die entsprechende App, wodurch der bekannte Chatbot effektiv in ein umfassendes Musikproduktionsstudio verwandelt wird.

Die neue Version Lyria 3 erweitert die Fähigkeiten früherer experimenteller Iterationen erheblich und bietet eine Vielzahl innovativer Funktionen. Ein zentraler Aspekt dieser Entwicklung ist die Einführung multimodaler Eingabemöglichkeiten. Nutzer sind nicht mehr ausschließlich auf Textbefehle angewiesen, sondern können dem System auch Fotos oder Videos zur Analyse bereitstellen. Das Modell ist in der Lage, den visuellen Rhythmus und die Stimmung eines Mediums zu erfassen, um darauf basierend einen passenden Soundtrack zu erstellen – etwa durch die Vertonung einer regnerischen Straßenszene mit atmosphärischem Lo-Fi-Jazz.

Zusätzlich zur instrumentalen Komposition beherrscht Lyria 3 nun auch die Erstellung von Songtexten und die Generierung von Gesangsstimmen. Zum aktuellen Zeitpunkt unterstützt das System vokale Darbietungen in acht verschiedenen Sprachen, darunter Englisch, Spanisch, Japanisch, Koreanisch und Hindi. Für Anwender, die mit arabischen Klängen experimentieren möchten, steht diese Sprachoption bereits in einer Beta-Phase zur Verfügung.

Um den Nutzern eine präzise Gestaltung ihrer Werke zu ermöglichen, bietet die Benutzeroberfläche detaillierte Kontrollmechanismen. Anwender können Parameter wie das Tempo, den Genre-Stil und die instrumentale Dichte individuell anpassen. Lyria 3 erzeugt dabei hochauflösende 30-Sekunden-Clips, die sich nahtlos verlängern oder in einer Endlosschleife abspielen lassen, ohne dass die musikalische Kohärenz verloren geht.

Ein weiteres Highlight der Veröffentlichung ist die Synergie mit Googles neuestem Bildgenerierungsmodell, das intern unter dem Codenamen „Nano Banana“ geführt wird. Dieses System ist Teil der Gemini 2.5 Flash Image-Familie und wurde speziell in den kreativen Prozess integriert. Es analysiert automatisch die Texte und die Stimmung des generierten Musiktitels, um für jeden Song ein einzigartiges und qualitativ hochwertiges Album-Cover zu entwerfen.

Google legte bei der Vorstellung großen Wert auf die Feststellung, dass Lyria 3 unter strikter Einhaltung von Urheberrechtsvorgaben und Sicherheitsstandards für Künstler entwickelt wurde. Das Unternehmen implementierte spezifische Schutzmaßnahmen, um den Missbrauch der Technologie zu verhindern und die Integrität kreativer Werke zu wahren.

Ein wesentlicher Bestandteil dieser Sicherheitsarchitektur sind die sogenannten Anti-Mimikry-Schutzwälle. Das Modell ist darauf programmiert, Anfragen abzulehnen, die darauf abzielen, die Identität oder den Stil spezifischer Künstler exakt zu kopieren. Sollte ein Nutzer beispielsweise einen Titel „im Stil von Taylor Swift“ anfordern, nutzt das System diese Eingabe lediglich als allgemeine kreative Inspiration, stellt jedoch sicher, dass weder die Stimme noch die charakteristischen Melodiestrukturen der Künstlerin geklont werden.

Zur eindeutigen Kennzeichnung von KI-Inhalten werden alle Audio-Ausgaben mit SynthID versehen. Hierbei handelt es sich um ein für das menschliche Ohr nicht wahrnehmbares Wasserzeichen, das direkt in die Audiodaten eingebettet wird. Diese Technologie ist so robust konzipiert, dass sie selbst nach einer Komprimierung, Bearbeitung oder Neuabmischung nachweisbar bleibt, wodurch die Identifizierung von KI-generierten Inhalten jederzeit gewährleistet ist.

Die neuen Funktionen werden ab heute schrittweise für Gemini-Nutzer ab 18 Jahren auf globaler Ebene ausgerollt. Google positioniert Lyria 3 damit als ernsthaften Konkurrenten zu bestehenden Diensten wie Suno und Udio. Durch die tiefe Einbindung in das eigene Ökosystem möchte der Technologiekonzern fortschrittliche Werkzeuge zur Musikschöpfung einem breiten Massenpublikum zugänglich machen.

Branchenexperten sehen in diesem Schritt eine signifikante Verschiebung im Bereich der generativen Künstlichen Intelligenz. Die Kombination aus Text-, Bild- und Tonverarbeitung in einer einzigen Plattform unterstreicht Googles Ambition, die führende Rolle im Bereich der KI-gestützten Kreativwerkzeuge einzunehmen. Die nahtlose Verzahnung der verschiedenen Modelle ermöglicht einen Workflow, der bisher professionellen Studios vorbehalten war.

Während die technologische Basis von Lyria 3 auf komplexen neuronalen Netzen beruht, bleibt die Bedienung intuitiv und für Laien verständlich. Dies könnte die Art und Weise, wie Inhalte für soziale Medien, Podcasts oder private Projekte erstellt werden, nachhaltig verändern. Die kommenden Monate werden zeigen, wie die globale Nutzerbasis diese neuen Möglichkeiten in ihren kreativen Alltag integriert.

Abschließend betont Google, dass die Entwicklung von Lyria 3 ein fortlaufender Prozess ist. Feedback der weltweiten Community soll direkt in zukünftige Updates einfließen, um die Präzision der Sprachausgabe und die Vielfalt der musikalischen Stile kontinuierlich zu erweitern. Damit setzt das Unternehmen ein klares Zeichen für die Zukunft der digitalen Kunstproduktion.

9 Ansichten

Quellen

  • Google DeepMind

Haben Sie einen Fehler oder eine Ungenauigkeit festgestellt?Wir werden Ihre Kommentare so schnell wie möglich berücksichtigen.