Kling Video O1 隆重登場：全球首款整合生成與文本編輯的全方位模型

22:08, 06 十二月

编辑者： Veronika Radoslavskaya

iframe { display: none; }

人工智慧影片生成領域正經歷一場重大的變革。快手（Kuaishou）隆重推出了強大的全新基礎模型 Kling Video O1（全名為 Omni One），它被定位為全球首個用於影片生成與進階編輯的統一多模態引擎。這項技術的問世，徹底打破了過去創意工作流程的碎片化局面，創作者不再需要頻繁切換於獨立的工具之間來完成影片的生成、編輯與精修工作。

iframe { display: none; }

O1 的核心技術突破在於其接受複雜輸入的能力。它可以在一個無縫的工作流程中處理多種輸入，包括文字提示、多張參考圖像（最多七張）以及現有的影片片段。這種統一的多模態引擎不僅能生成高畫質的 1080p 畫面，更允許使用者僅透過自然語言指令，立即進行後製編輯。創作者現在可以輸入諸如「移除背景路人」、「將白天場景轉換為黃昏」，或是「更換主角的服裝」等指令，模型就能精準理解視覺脈絡並執行這些修改。

Kling Video O1 旨在解決業界長期存在的挑戰，尤其是在視覺連貫性方面。該模型經過精心設計，能夠在冗長的序列和複雜的運鏡過程中，維持卓越的角色一致性與風格穩定性，有效避免了視覺上的「漂移」或閃爍偽影，表現得如同專業的人類導演一般。此外，該模型提供了細緻的控制功能，例如起點與終點影格控制，讓編輯人員能精確定義鏡頭的起始與結束位置，從而實現流暢的轉場效果，並能對靜態圖像進行精確的動畫處理。

儘管基礎片段的生成長度通常在五到十秒之間，但 O1 的架構設計支援生成更長、敘事更連貫的影片內容，據悉其可延伸長度可達兩分鐘。這對於需要連續敘事場景的專業製作而言，無疑是一大福音，大幅提升了製作效率。

在技術層面，Kling Video O1 具備思維鏈（Chain-of-Thought, CoT）推理系統，這增強了其對提示詞的分析能力和對物理世界的理解。在複雜轉換任務的基準測試中，它展現出顯著的性能優勢，超越了 Google Veo 3.1 和 Runway Aleph 等競爭對手。透過將文本到影片、場景延伸和編輯這七大關鍵創意功能融為一爐，Kling Video O1 無疑為專業影音製作樹立了新的效率標竿，確保從概念發想到最終剪輯都能維持高品質與高度一致性。

46 浏览量

來源

מגזין גאדג'טים וטכנולוגיה - Gadgety.co.il | גאדג'טי
Kling's Video O1 launches as the first all-in-one video model for generation and editing
Kling AI Launches O1, the Industry's First Unified Multimodal Video Model, Revolutionizing Content Creation and Editing - Barchart.com
Kling AI releases unified video model - Kr Asia
'Nano Banana' of AI Video: Chinese platform Kling AI Launches O1 AI Video Editing Model
Creativity AI #52: Runway claims the top spot, Kling goes multimodal, and Midjourney rethinks its UI - Medium

通知中心

Kling Video O1 隆重登場：全球首款整合生成與文本編輯的全方位模型

來源

阅读更多关于此主题的文章：