Runway Gen-4.5 嶄新登場,在影片生成 AI 基準測試中超越業界巨擘
编辑者: Veronika Radoslavskaya
獨立 AI 新創公司 Runway 近期發布了其最新的文字轉影片模型 Runway Gen-4.5,此舉立刻在競爭激烈的市場中投下震撼彈。這款新模型在權威的 Artificial Analysis 文字轉影片基準測試中,以 1247 的 Elo 分數傲視群雄,微幅領先了 Google 的 Veo 3 和 OpenAI 的 Sora 2 Pro。這項勝利充分展現了 Runway 在開發響應迅速、可控性高且整合性強的工作流程工具方面的卓越實力,這些工具是與 Nvidia 合作並利用優化硬體所打造的成果。
Gen-4.5 據稱在視覺一致性以及對使用者指令的響應能力上,相較於前代模型有了顯著提升,能夠產出具有電影質感的成果。這項進展旨在為內容創作者和企業用戶擴展其創意邊界。Runway 的傳統優勢在於其全面的基於瀏覽器的生態系統,這使得快速迭代、對鏡頭運動的精確控制,以及與現有專業編輯工具的無縫整合成為可能。因此,對於那些重視敏捷工作流程而非複雜基礎設施的獨立創作者和內容代理商來說,Gen-4.5 成了一個備受青睞的選擇。
然而,儘管技術層面取得了突破,業界普遍面臨的根本性挑戰依然存在。Runway 坦承,Gen-4.5 在處理當前所有影片模型都受困擾的基本弱點時,仍顯得力不從心。這些弱點包括因果關係(系統無法準確模擬物理事件,例如推動門把手後門才會開啟)和物體恆存性(物體在被遮擋時可能會短暫消失)。此外,該模型還表現出「成功偏誤」,即它模擬成功動作的頻率高於現實情況。
這些持續存在的技術難題,凸顯出業界尚未能建立起真正可靠、能精確模擬真實世界物理規律的「世界模型」。這也是 Runway 承諾將持續投入研發的重點領域。與此同時,在特定領域的競爭依然十分激烈:像 Google 的 Veo 3 這樣的競爭對手,在專門的 4K 照片級真實感和內建原生音訊方面仍佔有優勢;而 Sora 2 Pro 則更專注於複雜的物理模擬和多鏡頭的一致性表現。
總體而言,Runway Gen-4.5 的推出鞏固了其在整合式創意工具領域的基準領導地位。這項新模型將會陸續向所有 Runway 用戶開放使用,預計在未來幾天內全面普及。這場技術競賽的發展,無疑將持續推動 AI 影片生成技術的邊界向前邁進。
來源
WinBuzzer
Seeking Alpha
alphaXiv
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?
我们会尽快处理您的评论。
