Google prezentuje model wideo AI Veo 3.1 z narzędziami Flow nowej generacji i bogatszym dźwiękiem

19:37, 15 października

Edytowane przez: Veronika Radoslavskaya

Dziedzina cyfrowej kreacji treści przechodzi obecnie znaczącą metamorfozę, co jest efektem wprowadzenia przez Google najnowszego modelu sztucznej inteligencji do generowania wideo, nazwanego Veo 3.1, a także istotnych ulepszeń w zintegrowanym pakiecie narzędzi filmowych Flow. Ta ewolucja oznacza fundamentalne przekalibrowanie instrumentów twórczych, oferując twórcom wizualnym możliwość realizacji skomplikowanych koncepcji z niespotykaną dotąd wiernością i precyzją kontroli. Główny nacisk w ogłoszeniu położono na zapewnienie zwiększonego realizmu, zaawansowanych możliwości synchronizacji dźwięku oraz głębszego, bardziej intuicyjnego zrozumienia struktury narracyjnej w ramach architektury AI.

Model Veo 3.1 stanowi rozwinięcie fundamentów pierwotnej wersji Veo 3, która została zaprezentowana w maju 2025 roku. Nowa iteracja udoskonala jakość wizualną poprzez lepsze renderowanie tekstur oraz bardziej subtelne oświetlenie otoczenia, przybliżając technologię do fotorealizmu. Co kluczowe, model ten osiąga teraz mistrzostwo w zaawansowanym generowaniu dźwięku, gwarantując, że efekty dźwiękowe i dialogi są precyzyjnie zsynchronizowane z akcją wizualną. Rozwiązuje to problem zrywający immersję, który często występował we wcześniejszych systemach generatywnych. Sztuczna inteligencja wykazuje również głębsze pojmowanie języka filmowego, co pozwala jej na ściślejsze dostosowanie się do konkretnych, stylistycznych wytycznych. Dla użytkowników dostępna jest także szybsza wersja modelu, Veo 3.1 Fast.

Ta zwiększona moc generatywna jest bezpośrednio kierowana przez zaktualizowane narzędzie Flow, które od momentu jego wprowadzenia umożliwiło stworzenie ponad 275 milionów filmów. Twórcy mają teraz do dyspozycji zestaw potężnych nowych funkcji zaprojektowanych w celu usprawnienia złożonych zadań produkcyjnych. Funkcja „Ingredients to Video” (Składniki do Wideo) umożliwia wprowadzanie wielu referencyjnych obrazów, co pozwala na ustanowienie spójnego wyglądu postaci i estetyki wizualnej w całej sekwencji, teraz z dopasowanym dźwiękiem. W przypadku bardziej ambitnych narracji, funkcja „Scene Extension” (Rozszerzenie Sceny) pozwala na wydłużenie generowanych klipów, łagodząc wcześniejsze ograniczenia związane z krótkimi formami, przy jednoczesnym zachowaniu ciągłości ścieżki dźwiękowej.

Pakiet Flow wprowadza również innowacyjne formy kontroli. Przykładem jest „Frames to Video” (Klatki do Wideo), która generuje płynny ruch między dwoma zdefiniowanymi przez użytkownika nieruchomymi obrazami, oczywiście z zsynchronizowanym dźwiękiem. Ponadto, narzędzia do manipulacji obiektami umożliwiają wstawianie lub usuwanie elementów w obrębie sceny, a system inteligentnie przelicza i stosuje realistyczne cienie oraz oświetlenie. Te możliwości, w tym wstawianie i usuwanie obiektów, mają na celu redefinicję procesu twórczego dla deweloperów i użytkowników korporacyjnych, którzy uzyskują dostęp do technologii za pośrednictwem platform Gemini API i Vertex AI, jak również dla indywidualnych twórców.

Ten technologiczny skok podkreśla zaangażowanie Google w demokratyzację produkcji wideo wspomaganej przez AI o wysokiej wierności, oddając zaawansowaną kontrolę bezpośrednio w ręce wizjonerów. Koncentracja na rozwiązywaniu skomplikowanych problemów ciągłości wizualnej, takich jak utrzymanie spójnego oświetlenia podczas wstawiania obiektów, sugeruje głębokie zrozumienie subtelnych elementów, które przekształcają symulację w porywającą sztukę. Analizy branżowe wskazują, że modele osiągające wysoką spójność czasową cieszą się najwyższymi wskaźnikami przyjęcia wśród profesjonalnych studiów. To pozycjonuje nacisk Veo 3.1 na trwałość obiektów i rozszerzanie sceny jako niezwykle istotny dla profesjonalnej społeczności twórczej.

Źródła

Beebom
9to5Google
Google Developers Blog
TechCrunch
BGR
Google Cloud Blog

Przeczytaj więcej wiadomości na ten temat:

17 października

Windows 11: Microsoft przekształca komputer w inteligentnego asystenta dzięki Copilot

15 października

Claude Haiku 4.5 od Anthropic wywołuje załamanie cen AI, demokratyzując wydajność bliską czołówce

14 października

Microsoft wyznacza niezależny kurs w dziedzinie AI, wprowadzając własny generator MAI-Image-1

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.

Centrum powiadomień

Centrum powiadomień

Google prezentuje model wideo AI Veo 3.1 z narzędziami Flow nowej generacji i bogatszym dźwiękiem

Źródła

Przeczytaj więcej wiadomości na ten temat: