Kling Video O1 Diluncurkan: Model Terpadu Pertama di Dunia untuk Generasi dan Penyuntingan Berbasis Teks

Diedit oleh: Veronika Radoslavskaya

Lanskap video kecerdasan buatan (AI) kini mengalami pergeseran signifikan seiring dengan diperkenalkannya Kling Video O1 (Omni One). Model fondasi baru ini diposisikan sebagai mesin multimodal terpadu pertama di dunia yang mampu menangani baik pembuatan video maupun penyuntingan tingkat lanjut. Dikembangkan oleh Kuaishou, model ini secara fundamental mengubah alur kerja kreatif yang sebelumnya terfragmentasi, menghilangkan kebutuhan bagi para kreator untuk berpindah-pindah antar perangkat lunak terpisah demi proses penciptaan, pengeditan, dan penyempurnaan.

Terobosan teknologi utama dari O1 terletak pada kemampuannya menerima serangkaian input yang kompleks dalam satu alur kerja yang mulus. Input ini mencakup perintah teks, beberapa gambar referensi—hingga tujuh buah—serta klip video. Dengan mesin multimodal terpadu ini, para kreator dapat menghasilkan adegan berdefinisi tinggi 1080p dan segera menerapkan pengeditan pascaproduksi hanya dengan menggunakan perintah bahasa alami. Pengguna kini dapat mengetikkan instruksi seperti “hilangkan orang yang lewat di latar belakang,” “ubah siang hari menjadi senja,” atau “ganti pakaian karakter utama,” dan model akan memahami konteks visual untuk melaksanakan modifikasi tersebut secara akurat.

Kling Video O1 dirancang untuk mengatasi tantangan industri yang sudah lama ada, terutama terkait konsistensi visual. Model ini direkayasa untuk mempertahankan konsistensi karakter dan gaya yang luar biasa di sepanjang urutan yang panjang serta pergerakan kamera yang rumit. Fungsinya menyerupai sutradara manusia yang mencegah terjadinya “pergeseran” visual atau artefak kedipan. Selain itu, model ini menawarkan kontrol yang sangat terperinci melalui fitur seperti kontrol Bingkai Awal dan Akhir (Start and End Frame control). Fitur ini memungkinkan editor menentukan secara pasti titik awal dan akhir sebuah bidikan, sehingga memfasilitasi transisi yang mulus dan animasi gambar diam yang presisi.

Meskipun klip dasar yang dihasilkan biasanya berdurasi sekitar 5 hingga 10 detik, arsitektur O1 mendukung pembuatan klip naratif yang lebih panjang dan koheren. Ada laporan yang mengindikasikan bahwa panjang klip ini dapat diperpanjang hingga dua menit. Kemampuan ini sangat krusial untuk produksi konten yang membutuhkan kesinambungan cerita yang lebih panjang.

Kekuatan teknis Kling Video O1 juga mencakup sistem penalaran Chain-of-Thought (CoT) yang berfungsi untuk meningkatkan analisis perintah dan pemahaman fisika dalam adegan. Hasil tolok ukur menunjukkan keunggulan kinerja yang signifikan dibandingkan pesaing seperti Google Veo 3.1 dan Runway Aleph dalam tugas transformasi yang kompleks. Dengan menggabungkan tujuh kapabilitas kreatif utama—mulai dari teks-ke-video hingga perpanjangan adegan dan penyuntingan—Kling Video O1 menetapkan standar baru untuk efisiensi profesional. Hal ini memastikan kualitas dan konsistensi yang tinggi mulai dari tahap konsep awal hingga hasil akhir pengeditan.

13 Tampilan

Sumber-sumber

  • מגזין גאדג'טים וטכנולוגיה - Gadgety.co.il | גאדג'טי

  • Kling's Video O1 launches as the first all-in-one video model for generation and editing

  • Kling AI Launches O1, the Industry's First Unified Multimodal Video Model, Revolutionizing Content Creation and Editing - Barchart.com

  • Kling AI releases unified video model - Kr Asia

  • 'Nano Banana' of AI Video: Chinese platform Kling AI Launches O1 AI Video Editing Model

  • Creativity AI #52: Runway claims the top spot, Kling goes multimodal, and Midjourney rethinks its UI - Medium

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.

Kling Video O1 Diluncurkan: Model Terpadu ... | Gaya One