Runway Gen-4.5 опережает гигантов индустрии, занимая первое место в бенчмарке видео-ИИ

Отредактировано: Veronika Radoslavskaya

Независимый лидер в области ИИ, компания Runway, представила свою новейшую модель преобразования текста в видео — Runway Gen-4.5. Этот релиз немедленно вызвал переполох на высококонкурентном рынке. Новая модель заняла лидирующую позицию в авторитетном отраслевом тесте Artificial Analysis Text-to-Video benchmark, набрав счет Эло 1247. Это ставит ее на ступень выше таких мощных конкурентов, как Veo 3 от Google и Sora 2 Pro от OpenAI.

Этот успех наглядно демонстрирует, насколько эффективен подход Runway, ориентированный на создание инструментов с отзывчивым управлением и глубокой интеграцией в рабочий процесс. Разработка велась в тесном сотрудничестве с Nvidia с использованием оптимизированного аппаратного обеспечения. Gen-4.5 отличается значительно возросшей визуальной согласованностью и более точным откликом на команды пользователя по сравнению с предыдущими версиями. Цель — предоставить кинематографическое качество вывода, расширяя творческие горизонты как для индивидуальных создателей контента, так и для крупных предприятий.

Традиционно сильной стороной Runway является ее всеобъемлющая экосистема, работающая через браузер. Эта платформа позволяет быстро вносить итерации, осуществлять тонкий контроль над движениями камеры и бесшовно интегрироваться с существующими профессиональными инструментами редактирования. Именно эти факторы делают Gen-4.5 выбором многих независимых творцов и контент-агентств, которые ставят во главу угла гибкость рабочего процесса, а не сложность инфраструктуры.

Тем не менее, несмотря на достигнутый технический прогресс, перед всей индустрией видеогенерации стоят общие, нерешенные проблемы. В Runway признают, что Gen-4.5 все еще страдает от фундаментальных недостатков, присущих всем современным видеомоделям. К ним относятся проблемы с причинно-следственными связями (когда система не может корректно смоделировать физическое событие, например, что дверь открывается только после нажатия на ручку) и постоянством объектов (объекты могут временно исчезать, если их что-то загораживает).

Кроме того, модель демонстрирует так называемую «предвзятость успеха», то есть она симулирует успешное выполнение действий гораздо чаще, чем это происходило бы в реальной жизни. Эти сохраняющиеся трудности подчеркивают, что индустрия еще далека от создания по-настоящему надежных «моделей мира», способных точно имитировать реальную физику. Это та область, в которую Runway планирует активно инвестировать свои дальнейшие разработки.

Конкуренция остается ожесточенной, особенно в нишевых областях. Например, конкуренты, такие как Veo 3 от Google, сохраняют лидерство в области специализированного фотореализма в разрешении 4K и нативной интеграции звука. В то же время, Sora 2 Pro от OpenAI делает упор на сложную физическую симуляцию и поддержание согласованности на протяжении нескольких сцен. Введение Gen-4.5, которое будет поэтапно открываться для всех пользователей Runway в ближайшие дни, укрепляет позиции компании как лидера в области интегрированных творческих инструментов, задавая новый ориентир для отрасли.

Источники

  • WinBuzzer

  • Seeking Alpha

  • alphaXiv

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.