Google svela Lyria 3: l'intelligenza artificiale musicale integrata direttamente in Gemini

Autore: Veronika Radoslavskaya

Il 18 febbraio 2026 segna una data fondamentale per l'evoluzione tecnologica di Google DeepMind, che ha annunciato ufficialmente il rilascio su scala globale di Lyria 3. Questo nuovo sistema rappresenta il modello di generazione musicale più sofisticato mai sviluppato dal colosso di Mountain View. Distaccandosi dalle versioni di ricerca precedenti, Google ha deciso di integrare questo potente strumento direttamente nell'interfaccia web e nell'applicazione mobile di Gemini. Questa mossa strategica trasforma il chatbot in un vero e proprio studio di produzione musicale accessibile a chiunque, democratizzando l'accesso a tecnologie di composizione che prima richiedevano competenze tecniche elevate.

Una delle caratteristiche più rivoluzionarie di Lyria 3 è la sua capacità di gestire input multimodali, superando il tradizionale paradigma dei comandi testuali. Gli utenti possono ora caricare fotografie o filmati affinché l'intelligenza artificiale ne analizzi il contenuto visivo, il ritmo e l'atmosfera emotiva. Ad esempio, caricando il video di una strada metropolitana durante un temporale, il modello è in grado di comporre autonomamente un brano lo-fi jazz che rifletta perfettamente la malinconia e il ritmo della pioggia. Questa funzionalità apre scenari inediti per i creatori di contenuti che necessitano di colonne sonore sincronizzate con le proprie immagini.

Oltre alla parte strumentale, Lyria 3 introduce la capacità di generare testi poetici e performance vocali complete. A differenza delle versioni sperimentali del passato, il modello non si limita a suoni sintetici, ma può produrre voci umane espressive in otto lingue diverse. Attualmente, il supporto linguistico include inglese, spagnolo, giapponese, coreano e hindi, mentre la lingua araba è stata introdotta in una fase beta per perfezionarne le sfumature fonetiche. Questa versatilità permette di creare canzoni dotate di una struttura narrativa complessa, adatte a diversi contesti culturali e mercati internazionali.

Per i musicisti e i produttori più esigenti, Lyria 3 offre un livello di controllo granulare senza precedenti. Attraverso la nuova interfaccia di Gemini, è possibile regolare parametri tecnici come il tempo, lo stile del genere musicale e la cosiddetta densità strumentale, ovvero la complessità degli arrangiamenti. Il sistema genera clip audio ad alta fedeltà della durata di 30 secondi che possono essere estese indefinitamente o trasformate in loop perfetti. Questa flessibilità rende lo strumento ideale non solo per brevi clip social, ma anche per la creazione di basi musicali più lunghe e articolate.

  • Input multimodale tramite analisi di immagini e video per colonne sonore coerenti.
  • Generazione di testi e voci realistiche in 8 lingue, con l'arabo in fase beta.
  • Controlli avanzati per personalizzare tempo, genere e densità sonora.
  • Produzione di clip da 30 secondi con funzioni di estensione e loop senza interruzioni.

L'esperienza creativa offerta da Google è completata dall'integrazione di un nuovo modello di generazione di immagini, identificato internamente con il nome in codice Nano Banana. Questo componente, che fa parte della famiglia di modelli Gemini 2.5 Flash Image, lavora in sinergia con Lyria 3 analizzando il contenuto semantico dei testi e il mood della musica prodotta. Il risultato è la creazione automatica di copertine d'album originali e di alta qualità, fornendo un'identità visiva coerente a ogni brano generato e facilitando così la condivisione dei progetti musicali.

In un'epoca di crescenti preoccupazioni etiche, Google ha posto una forte enfasi sulla sicurezza e sul rispetto del diritto d'autore durante lo sviluppo di Lyria 3. Il modello è stato addestrato con rigorosi protocolli per evitare la violazione della proprietà intellettuale degli artisti. Sono stati implementati dei sistemi di protezione anti-mimica che impediscono al software di replicare fedelmente lo stile di musicisti famosi. Se un utente tentasse di generare una traccia nello stile di Taylor Swift, l'intelligenza artificiale utilizzerebbe il prompt solo come una vaga ispirazione creativa, assicurandosi di non clonare la voce o le progressioni melodiche distintive dell'artista.

Per garantire la massima trasparenza, ogni file audio generato da Lyria 3 incorpora la tecnologia SynthID. Si tratta di un watermark digitale impercettibile all'orecchio umano, ma estremamente resistente ai processi di manipolazione. Questo marchio rimane rilevabile anche se la traccia viene compressa in formati diversi, editata pesantemente o mixata con altri elementi sonori. Grazie a questa soluzione, i contenuti creati tramite intelligenza artificiale potranno essere sempre identificati come tali, offrendo una tutela aggiuntiva sia per i consumatori che per l'industria musicale tradizionale.

La nuova suite di strumenti musicali ha iniziato il suo roll-out globale oggi, diventando accessibile a tutti gli utenti Gemini maggiorenni. Google posiziona chiaramente Lyria 3 come un concorrente diretto di servizi emergenti come Suno e Udio. Sfruttando la sua vasta infrastruttura e l'integrazione nativa nei propri servizi web e mobile, l'azienda mira a portare la produzione musicale assistita dall'intelligenza artificiale a un pubblico di massa, eliminando le barriere d'ingresso per la creatività sonora a livello mondiale.

9 Visualizzazioni

Fonti

  • Google DeepMind

Hai trovato un errore o un'inaccuratezza?Esamineremo il tuo commento il prima possibile.