Google prezentuje Lyria 3: Zaawansowane studio muzyczne AI zintegrowane bezpośrednio z Gemini

Autor: Veronika Radoslavskaya

18 lutego 2026 roku firma Google DeepMind oficjalnie ogłosiła globalne wdrożenie Lyria 3, swojego najbardziej zaawansowanego modelu do generowania muzyki, jaki kiedykolwiek powstał. Narzędzie to, wychodząc poza fazę zamkniętych testów badawczych, zostało udostępnione użytkownikom na całym świecie za pośrednictwem interfejsu Gemini, zarówno w wersji przeglądarkowej, jak i mobilnej. Tym samym popularny chatbot przekształcił się w kompleksowe studio produkcji muzycznej, dostępne dla każdego na wyciągnięcie ręki.

Możliwości Lyria 3 znacząco przewyższają to, co oferowały wcześniejsze wersje eksperymentalne, wprowadzając przede wszystkim zaawansowaną obsługę danych multimodalnych. Użytkownicy nie są już ograniczeni wyłącznie do wpisywania poleceń tekstowych. Model potrafi teraz analizować przesłane zdjęcia lub filmy, aby na ich podstawie stworzyć ścieżkę dźwiękową idealnie oddającą rytm i nastrój obrazu, jak na przykład generowanie kojącego jazzu typu lo-fi do nagrania przedstawiającego deszczową ulicę.

Kolejnym istotnym krokiem milowym jest funkcja generowania tekstów piosenek oraz profesjonalnych partii wokalnych. W przeciwieństwie do poprzednich iteracji, Lyria 3 potrafi samodzielnie pisać słowa i tworzyć wysokiej jakości wykonania wokalne. Obecnie system obsługuje wokale w ośmiu językach, w tym angielskim, hiszpańskim, japońskim, koreańskim oraz hindi, natomiast wsparcie dla języka arabskiego jest już dostępne w fazie beta.

Użytkownicy otrzymali również dostęp do bardzo precyzyjnych narzędzi kontroli nad procesem twórczym. Nowy interfejs pozwala na płynną regulację tempa utworu, wybór konkretnego stylu gatunkowego oraz określenie tak zwanej „gęstości” instrumentacji. Pozwala to na dostosowanie brzmienia do bardzo specyficznych wymagań artystycznych, co czyni narzędzie użytecznym zarówno dla amatorów, jak i profesjonalistów.

Model generuje wysokiej jakości klipy o długości 30 sekund, które można w sposób bezszwowy przedłużać lub zapętlać. Dzięki temu twórcy mogą budować dłuższe kompozycje, zachowując pełną spójność brzmienia i rytmu w całym utworze. Otwiera to zupełnie nowe możliwości przed producentami treści wideo, podcasterami oraz twórcami internetowymi, którzy potrzebują unikalnej oprawy dźwiękowej.

W celu zapewnienia kompleksowego wsparcia kreatywnego, Google zintegrowało system ze swoim najnowszym modelem graficznym o nazwie kodowej „Nano Banana”. Jest on częścią rodziny Gemini 2.5 Flash Image i automatycznie analizuje treść oraz nastrój wygenerowanego utworu. Na tej podstawie system tworzy unikalną, profesjonalną okładkę albumu dla każdej stworzonej piosenki, dbając o spójną identyfikację wizualną projektu.

Podczas prezentacji Google położyło ogromny nacisk na fakt, że Lyria 3 została wytrenowana z pełnym poszanowaniem praw autorskich i bezpieczeństwa artystów. Firma wdrożyła szereg rygorystycznych mechanizmów ochronnych, które mają zapobiegać nieetycznemu wykorzystaniu sztucznej inteligencji oraz chronić własność intelektualną twórców w przemyśle muzycznym.

Jednym z kluczowych zabezpieczeń są bariery typu „anti-mimicry”, które blokują prośby o wierne kopiowanie stylu konkretnych wykonawców. Jeśli system otrzyma polecenie stworzenia utworu „w stylu Taylor Swift”, potraktuje to zapytanie jedynie jako ogólną inspirację twórczą. Algorytm dba o to, by nie klonować głosu piosenkarki ani jej charakterystycznych struktur melodycznych, chroniąc jej unikalną tożsamość artystyczną.

Wszystkie pliki audio generowane przez model są trwale znakowane technologią SynthID. Jest to niesłyszalny dla ludzkiego ucha cyfrowy znak wodny, który pozostaje możliwy do wykrycia nawet w przypadku edycji, miksowania czy silnej kompresji dźwięku. Umożliwia to łatwą identyfikację treści stworzonych przez sztuczną inteligencję, co jest kluczowe dla zachowania transparentności w nowoczesnym świecie cyfrowym.

Nowa funkcja zaczęła być udostępniana dzisiaj dla pełnoletnich użytkowników Gemini (18+) na całym świecie. Google pozycjonuje ten debiut jako bezpośrednie wyzwanie dla popularnych usług takich jak Suno czy Udio. Wykorzystując głęboką integrację ze swoim potężnym ekosystemem usług cyfrowych, gigant technologiczny dąży do upowszechnienia zaawansowanych narzędzi do tworzenia muzyki wśród masowego odbiorcy.

Dzięki tak szerokiemu zasięgowi, firma z Mountain View ma szansę wprowadzić zaawansowaną produkcję dźwięku do głównego nurtu. Integracja z Gemini sprawia, że tworzenie profesjonalnie brzmiącej muzyki staje się dostępne dla każdego, kto posiada dostęp do internetu. To rozwiązanie nie tylko demokratyzuje proces twórczy, ale również wyznacza nowe standardy w dziedzinie generatywnej sztucznej inteligencji.

9 Wyświetlenia

Źródła

  • Google DeepMind

Czy znalazłeś błąd lub niedokładność?Rozważymy Twoje uwagi tak szybko, jak to możliwe.