Kling Video O1: Il Primo Modello All-in-One al Mondo per Generazione e Modifica Testuale di Video
Modificato da: Veronika Radoslavskaya
Il panorama della video generazione tramite intelligenza artificiale sta vivendo una svolta epocale con l'introduzione di Kling Video O1 (Omni One). Questo nuovo e potente modello di base si posiziona come il primo motore multimodale unificato al mondo, capace sia di creare video che di eseguire modifiche avanzate. Sviluppato da Kuaishou, questo strumento rivoluziona il flusso di lavoro creativo, precedentemente frammentato, eliminando la necessità per i creatori di passare continuamente tra applicazioni separate per la concezione, la rifinitura e la post-produzione.
La vera innovazione tecnologica di O1 risiede nella sua straordinaria capacità di accettare un insieme complesso di input all'interno di un unico flusso operativo fluido. Questo include istruzioni testuali, fino a sette immagini di riferimento e clip video preesistenti. Grazie a questo motore multimodale unificato, gli utenti possono generare scene ad alta fedeltà a 1080p e, immediatamente dopo, applicare modifiche di post-produzione utilizzando esclusivamente comandi in linguaggio naturale. Ad esempio, è possibile impartire istruzioni come “rimuovi il passante sullo sfondo,” “trasforma il giorno in crepuscolo,” o “cambia l’abbigliamento del personaggio principale,” e il modello interpreta il contesto visivo per eseguire le alterazioni con estrema precisione.
Kling Video O1 affronta sfide storiche del settore, in particolare quelle legate alla coerenza visiva. Il modello è stato progettato per mantenere una notevole coerenza del personaggio e dello stile attraverso sequenze prolungate e movimenti di camera complessi. Agisce quasi come un regista umano, prevenendo la deriva visiva o la comparsa di artefatti di sfarfallio che affliggono spesso i sistemi meno sofisticati. Inoltre, il modello offre un controllo granulare attraverso funzionalità come il controllo del Frame di Inizio e Fine. Questo permette agli editor di definire con esattezza dove una ripresa deve iniziare e terminare, facilitando transizioni impeccabili e l'animazione precisa di immagini statiche. Sebbene le clip di base generate abbiano una durata tipica di 5-10 secondi, l'architettura di O1 è in grado di sostenere la creazione di sequenze narrative più lunghe e coese, con report che indicano una potenziale estensione fino a due minuti.
Dal punto di vista tecnico, Kling Video O1 vanta notevoli punti di forza. Tra questi spicca un sistema di ragionamento Chain-of-Thought (CoT), essenziale per affinare l'analisi dei prompt e per una comprensione più profonda delle leggi fisiche applicate alla scena. I risultati dei benchmark dimostrano vantaggi prestazionali significativi rispetto a concorrenti di rilievo come Google Veo 3.1 e Runway Aleph, specialmente nei compiti di trasformazione complessa. Integrando queste sette capacità creative fondamentali – che spaziano dal testo-a-video all'estensione di scena e alla modifica diretta – Kling Video O1 stabilisce un nuovo standard di efficienza professionale. Assicura, di fatto, un livello di qualità e uniformità elevato, dal primo schizzo concettuale fino al montaggio finale.
13 Visualizzazioni
Fonti
מגזין גאדג'טים וטכנולוגיה - Gadgety.co.il | גאדג'טי
Kling's Video O1 launches as the first all-in-one video model for generation and editing
Kling AI Launches O1, the Industry's First Unified Multimodal Video Model, Revolutionizing Content Creation and Editing - Barchart.com
Kling AI releases unified video model - Kr Asia
'Nano Banana' of AI Video: Chinese platform Kling AI Launches O1 AI Video Editing Model
Creativity AI #52: Runway claims the top spot, Kling goes multimodal, and Midjourney rethinks its UI - Medium
Leggi altre notizie su questo argomento:
Hai trovato un errore o un'inaccuratezza?
Esamineremo il tuo commento il prima possibile.
