Google Lança Lyria 3: Estúdio Musical de IA Integrado Diretamente ao Gemini

Autor: Veronika Radoslavskaya

No dia 18 de fevereiro de 2026, a divisão Google DeepMind anunciou oficialmente a expansão global do Lyria 3, consolidando-o como seu modelo de inteligência artificial para geração de música mais sofisticado até o momento. Deixando para trás as fases de visualização de pesquisa, a gigante tecnológica integrou a ferramenta diretamente na interface web e no aplicativo do Gemini, o que efetivamente converte o chatbot em um estúdio de produção musical acessível e abrangente para o público geral.

Esta nova versão do Lyria 3 apresenta um salto qualitativo em relação aos protótipos anteriores, introduzindo funcionalidades robustas que abrangem desde a síntese vocal até a análise de vídeo. O objetivo é proporcionar uma experiência multimodal completa, onde a inteligência artificial atua como uma colaboradora criativa capaz de interpretar diferentes formas de mídia para compor obras sonoras originais e envolventes.

  • Entrada Multimodal: Os usuários não estão mais limitados a descrições textuais para criar suas músicas. Agora, o modelo pode processar fotos ou vídeos carregados para gerar trilhas sonoras que correspondam perfeitamente ao ritmo visual e à atmosfera das imagens, como transformar um vídeo de uma rua chuvosa em um jazz lo-fi melancólico.
  • Geração de Letras e Vocais: Além da trilha instrumental, o Lyria 3 agora possui a capacidade de redigir letras e gerar performances vocais completas. Atualmente, a ferramenta suporta vocais em oito idiomas, incluindo inglês, espanhol, japonês, coreano e hindi, com o idioma árabe já disponível em uma versão beta para testes iniciais.
  • Controle Granular: Para os usuários que buscam maior precisão, a interface oferece controles que permitem o ajuste fino do tempo, do estilo do gênero e da densidade dos instrumentos. O modelo gera clipes de áudio de alta fidelidade com 30 segundos de duração, os quais podem ser estendidos ou transformados em loops contínuos sem interrupções perceptíveis.

Buscando oferecer uma solução criativa de ponta a ponta, a Google integrou o Lyria 3 ao seu mais novo modelo de geração de imagens, conhecido internamente pelo codinome 'Nano Banana'. Este sistema, que faz parte da família Gemini 2.5 Flash Image, analisa o conteúdo lírico e o tom emocional da música para gerar automaticamente capas de álbuns exclusivas e de alta qualidade para cada composição realizada pelo usuário.

A segurança e o respeito aos direitos autorais foram pilares centrais no desenvolvimento desta tecnologia. A Google enfatizou que o treinamento do Lyria 3 foi realizado sob diretrizes rigorosas para garantir a proteção dos artistas e da propriedade intelectual, implementando mecanismos que evitam a exploração indevida de estilos protegidos ou a criação de conteúdos que infrinjam normas éticas.

Entre as medidas de segurança, destacam-se as salvaguardas contra o mimetismo de artistas famosos. O modelo foi programado para recusar comandos que solicitem a replicação exata de vozes conhecidas. Caso um usuário peça uma música 'no estilo de Taylor Swift', o sistema utilizará a solicitação apenas como uma referência criativa genérica, assegurando que a voz ou as assinaturas melódicas da cantora não sejam clonadas pela IA.

Para garantir a transparência e a rastreabilidade, todos os arquivos de áudio gerados contêm o SynthID, uma marca d'água digital imperceptível ao ouvido humano. Esta tecnologia avançada permanece detectável mesmo após processos de compressão, edição ou mixagem, permitindo que o conteúdo criado por inteligência artificial seja sempre identificado como tal, promovendo a integridade no mercado musical digital.

A nova funcionalidade começou a ser disponibilizada hoje para usuários do Gemini com mais de 18 anos em escala global. Com este lançamento, a Google se posiciona como uma concorrente direta de plataformas especializadas como Suno e Udio, utilizando a força de seu vasto ecossistema integrado para democratizar o acesso a ferramentas de criação musical de nível profissional para uma audiência de massa.

9 Visualizações

Fontes

  • Google DeepMind

Encontrou um erro ou imprecisão?Vamos considerar seus comentários assim que possível.