Nvidia представляет Alpamayo-R1: открытая модель рассуждений VLA для «Физического ИИ»

Отредактировано: Veronika Radoslavskaya

Компания Nvidia официально представила свою новую разработку, Alpamayo-R1 (AR1), на конференции по искусственному интеллекту NeurIPS. Этот запуск знаменует собой важный технический этап в стратегическом смещении фокуса генерального директора Дженсена Хуанга в сторону «Физического ИИ». Под этим термином понимается развертывание интеллектуальных систем, которые непосредственно управляют машинами, взаимодействующими с физическим миром. AR1 позиционируется как открытая модель языка для визуального рассуждения, призванная вывести автономное вождение за рамки жестко запрограммированных правил, приближая его к человеческому подходу принятия решений, основанному на здравом смысле.

Основная цель этой модели — продемонстрировать практический путь для исследований, направленных на достижение Уровня 4 автономности, то есть полного самоуправления в заранее определенных условиях. Это амбициозная задача, требующая не просто реагирования, но и глубокого понимания контекста.

Ключевым технологическим прорывом в AR1 является ее система Vision-Language-Action (VLA). Этот конвейер обрабатывает визуальные данные, поступающие с камер, совместно с текстовыми инструкциями на естественном языке. Что особенно важно, он интегрирует интерпретируемое рассуждение по принципу «Цепочки причинности» непосредственно с планированием траектории движения. Благодаря этой усовершенствованной структуре рассуждений, AR1 успешно противостоит известной уязвимости традиционных моделей имитационного обучения «от начала до конца».

Эти традиционные модели часто демонстрируют слабость в непредсказуемых, критически важных для безопасности дорожных ситуациях, где понимание причинно-следственных связей зачастую ограничено. В отличие от них, AR1 оценивает сложные сценарии и способен прогнозировать маневры других участников дорожного движения. Такой систематический подход к рассуждению привел к значительным улучшениям в точности планирования по сравнению с базовыми моделями, ориентированными только на траекторию, что было подтверждено в сложных симуляциях.

Более того, модель продемонстрировала производительность в реальном времени с низкой задержкой во время дорожных испытаний на борту транспортных средств. Это критически важный показатель для систем, где миллисекунды могут иметь решающее значение для безопасности. Успешное сочетание сложного рассуждения и оперативной скорости делает AR1 серьезным претендентом на звание следующего поколения систем управления.

Для стимулирования широкого внедрения и развития этой архитектуры Nvidia одновременно выпустила в открытый доступ на GitHub ресурс под названием Cosmos Cookbook. Этот обширный пакет содержит необходимые руководства, инструменты и рабочие процессы, специально разработанные для помощи разработчикам в развертывании и тонкой настройке базовой платформы Cosmos. Область применения охватывает широкий спектр задач, включая робототехнику и автономные системы.

Подобный стратегический релиз весов модели и сопутствующих инструментов закрепляет за Nvidia роль поставщика фундаментальных технологий. Это подкрепляет стремление компании сделать свое аппаратное и программное обеспечение неотъемлемым стержнем для следующей революционной фазы взаимодействия машин с окружающим миром. По сути, Nvidia не просто выпускает продукт, а закладывает основу для всей экосистемы «Физического ИИ».

Источники

  • Punto Informatico

  • Nvidia Releases New AI Model Alpamayo-R1, Advancing Autonomous Driving Research

  • Nvidia Drops Alpamayo R1 As Open Source Leap Toward Level 4 Autonomy

  • NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025 | AIM

  • Nvidia lancia modello AI per la guida autonoma Alpamayo-R1

  • NVIDIA debuts Cosmos Reason AI model to advance physical AI and robotics

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.