Kling Video O1 隆重登場:全球首款整合生成與文本編輯的全方位模型
编辑者: Veronika Radoslavskaya
人工智慧影片生成領域正經歷一場重大的變革。快手(Kuaishou)隆重推出了強大的全新基礎模型 Kling Video O1(全名為 Omni One),它被定位為全球首個用於影片生成與進階編輯的統一多模態引擎。這項技術的問世,徹底打破了過去創意工作流程的碎片化局面,創作者不再需要頻繁切換於獨立的工具之間來完成影片的生成、編輯與精修工作。
O1 的核心技術突破在於其接受複雜輸入的能力。它可以在一個無縫的工作流程中處理多種輸入,包括文字提示、多張參考圖像(最多七張)以及現有的影片片段。這種統一的多模態引擎不僅能生成高畫質的 1080p 畫面,更允許使用者僅透過自然語言指令,立即進行後製編輯。創作者現在可以輸入諸如「移除背景路人」、「將白天場景轉換為黃昏」,或是「更換主角的服裝」等指令,模型就能精準理解視覺脈絡並執行這些修改。
Kling Video O1 旨在解決業界長期存在的挑戰,尤其是在視覺連貫性方面。該模型經過精心設計,能夠在冗長的序列和複雜的運鏡過程中,維持卓越的角色一致性與風格穩定性,有效避免了視覺上的「漂移」或閃爍偽影,表現得如同專業的人類導演一般。此外,該模型提供了細緻的控制功能,例如起點與終點影格控制,讓編輯人員能精確定義鏡頭的起始與結束位置,從而實現流暢的轉場效果,並能對靜態圖像進行精確的動畫處理。
儘管基礎片段的生成長度通常在五到十秒之間,但 O1 的架構設計支援生成更長、敘事更連貫的影片內容,據悉其可延伸長度可達兩分鐘。這對於需要連續敘事場景的專業製作而言,無疑是一大福音,大幅提升了製作效率。
在技術層面,Kling Video O1 具備思維鏈(Chain-of-Thought, CoT)推理系統,這增強了其對提示詞的分析能力和對物理世界的理解。在複雜轉換任務的基準測試中,它展現出顯著的性能優勢,超越了 Google Veo 3.1 和 Runway Aleph 等競爭對手。透過將文本到影片、場景延伸和編輯這七大關鍵創意功能融為一爐,Kling Video O1 無疑為專業影音製作樹立了新的效率標竿,確保從概念發想到最終剪輯都能維持高品質與高度一致性。
13 浏览量
來源
מגזין גאדג'טים וטכנולוגיה - Gadgety.co.il | גאדג'טי
Kling's Video O1 launches as the first all-in-one video model for generation and editing
Kling AI Launches O1, the Industry's First Unified Multimodal Video Model, Revolutionizing Content Creation and Editing - Barchart.com
Kling AI releases unified video model - Kr Asia
'Nano Banana' of AI Video: Chinese platform Kling AI Launches O1 AI Video Editing Model
Creativity AI #52: Runway claims the top spot, Kling goes multimodal, and Midjourney rethinks its UI - Medium
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?
我们会尽快处理您的评论。
