Runway Gen-4.5 异军突起,在视频AI基准测试中超越行业巨头

编辑者: Veronika Radoslavskaya

独立人工智能初创公司Runway近日发布了其最新的文生视频模型Runway Gen-4.5,此举立刻在竞争激烈的市场中掀起了波澜。该模型凭借1247的Elo评分,成功登顶权威的Artificial Analysis文生视频基准测试榜单,微弱领先于谷歌的Veo 3和OpenAI的Sora 2 Pro。这项胜利充分彰显了Runway的战略重点——即与英伟达合作,利用优化后的硬件,专注于构建响应迅速、可控性强且工作流程高度集成的工具。

Gen-4.5相较于其前代产品,在视觉一致性和对用户指令的响应能力上实现了显著提升,旨在为内容创作者和企业用户提供具有电影质感的输出效果,从而拓展其创作潜力。Runway的传统优势在于其基于浏览器的全面生态系统。该系统支持快速迭代,允许用户对摄像机运动进行精细控制,并能与现有的专业编辑工具无缝集成。这使得Runway成为那些重视敏捷工作流程而非复杂基础设施的独立创作者和内容代理机构的首选。

尽管技术上取得了这些突破,但行业内长期存在的根本性难题依然存在。Runway坦承,Gen-4.5在处理所有当前视频模型普遍面临的基础性弱点时,仍显不足。例如,模型在处理因果关系方面存在困难,这意味着系统可能无法准确模拟物理事件的逻辑顺序,比如在推开门把手之后才开门。此外,物体持久性问题也依然存在,物体在被遮挡时可能会短暂消失。

更值得注意的是,该模型表现出一种“成功偏见”,即它模拟成功发生的动作频率高于现实世界中应有的概率。这些持续存在的缺陷表明,业界尚未能构建出能够精确模拟真实世界物理规律的可靠“世界模型”。Runway表示,未来将持续投入资源攻克这一领域。

与此同时,在细分专业领域,竞争依然异常激烈。例如,谷歌的Veo 3在专用的4K照片级真实感渲染和原生音频集成方面仍保持领先地位,而Sora 2 Pro则更侧重于复杂的物理模拟和多镜头一致性。目前,Gen-4.5正在分阶段推出,预计在未来几天内向Runway的所有用户开放使用,从而巩固Runway作为集成式创意工具领域基准领导者的地位。

来源

  • WinBuzzer

  • Seeking Alpha

  • alphaXiv

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。