Runway Gen-4.5 Випереджає Гігантів Індустрії, Займаючи Перше Місце у Бенчмарку Відео-ШІ
Відредаговано: Veronika Radoslavskaya
Провідний незалежний стартап у сфері штучного інтелекту, компанія Runway, щойно представила свою останню розробку – модель для генерації відео з тексту під назвою Runway Gen-4.5. Цей реліз миттєво сколихнув висококонкурентний ринок. Нова модель наразі очолює авторитетний галузевий рейтинг Artificial Analysis Text-to-Video benchmark, демонструючи оцінку Ело на рівні 1247 пунктів. Це ставить її трохи попереду таких потужних конкурентів, як Veo 3 від Google та Sora 2 Pro від OpenAI.
Ця перемога Runway яскраво підкреслює ефективність стратегії компанії, зосередженої на створенні чутливих, керованих та глибоко інтегрованих інструментів для робочого процесу. Розробка Gen-4.5 велася у тісній співпраці з Nvidia, що дозволило оптимізувати апаратне забезпечення для досягнення максимальної продуктивності. За словами розробників, Gen-4.5 значно перевершує свого попередника у плані візуальної узгодженості та точності реагування на команди користувача. Результатом є вихід відео кінематографічної якості, що має на меті розширити творчі горизонти як для індивідуальних творців контенту, так і для великих підприємств.
Традиційна перевага Runway полягає у її комплексній екосистемі, доступній через браузер. Ця платформа забезпечує швидке ітераційне тестування, надає креаторам тонкий контроль над рухами камери та гарантує безшовну інтеграцію з існуючими професійними інструментами редагування. Саме ці аспекти роблять її фаворитом серед незалежних творців та контент-агенцій, які цінують гнучкість робочого процесу понад усе, навіть складну інфраструктуру.
Проте, незважаючи на значні технічні досягнення, галузь все ще стикається з певними системними викликами, які Runway визнає. Модель Gen-4.5, як і всі сучасні відео-генератори, має вроджені слабкості. Серед них виділяються проблеми з причинно-наслідковими зв'язками (наприклад, коли система не може коректно змоделювати, що двері відчиняються лише після натискання на ручку) та постійністю об'єктів (коли предмети можуть тимчасово зникати з поля зору, якщо їх щось закриває).
Крім того, модель демонструє так звану «упередженість успіху», коли змодельовані дії частіше завершуються успішно, ніж це відбувалося б у реальному житті. Ці нерозв'язані питання чітко вказують на те, що індустрія ще далека від створення по-справжньому надійних «моделей світу», які б точно імітували фізичні закони реальності. Це та сфера, де Runway планує продовжувати активні розробки, аби наздогнати час.
Конкуренція залишається надзвичайно високою у вузькоспеціалізованих нішах. Наприклад, конкуренти, такі як Veo 3 від Google, зберігають лідерство у сфері чистого 4K фотореалізму та нативної інтеграції звукового супроводу. Водночас, Sora 2 Pro від OpenAI продовжує робити акцент на складній фізичній симуляції та підтримці послідовності у багатосценових проєктах. Запуск Gen-4.5 відбувається поетапно, але найближчими днями вона стане доступною для всіх користувачів Runway, остаточно закріплюючи за компанією статус лідера у сфері інтегрованих творчих інструментів.
Джерела
WinBuzzer
Seeking Alpha
alphaXiv
Читайте більше новин на цю тему:
Знайшли помилку чи неточність?
Ми розглянемо ваші коментарі якомога швидше.
