Париж, Франція - Meta запустила V-JEPA 2, передову модель штучного інтелекту «світу», розроблену для розуміння та передбачення фізичного світу.
Ця нова модель з відкритим вихідним кодом може розуміти 3D-середовища та рух об'єктів. Це значний крок вперед порівняно з великими мовними моделями, що дозволяє штучному інтелекту навчатися, планувати та приймати рішення більше як люди.
V-JEPA 2 може розпізнати, що м'яч, який котиться зі столу, впаде. Він міркує у спрощеному «прихованому» просторі, щоб зрозуміти, як об'єкти рухаються та взаємодіють.
Головний науковець Meta з питань штучного інтелекту Ян Лекунн підкреслив різницю між розумінням мови та фізичним світом. Він пояснив, що модель світу діє як абстрактний цифровий двійник реальності, дозволяючи штучному інтелекту передбачати наслідки своїх дій.
Meta активно інвестує в штучний інтелект, плануючи інвестиції в розмірі 14 мільярдів доларів у Scale AI. Компанія зосереджується на штучному інтелекті, щоб конкурувати з іншими технологічними гігантами, такими як OpenAI та Google.
V-JEPA 2 призначений для використання в роботах-доставниках і безпілотних автомобілях. Ці машини повинні розуміти своє оточення в реальному часі для навігації.
Інші компанії також розробляють моделі світу. Google DeepMind працює над Genie, який може імітувати ігри та 3D-середовища. Фей-Фей Лі залучила 230 мільйонів доларів для стартапу під назвою World Labs, зосередженого на великих моделях світу.