Мышление кадрами: как «визуальное воображение» 1X Technologies приближает полную автономию роботов

Отредактировано: Veronika Radoslavskaya

Современная робототехника стремительно движется к будущему, в котором машины больше не полагаются на жесткие, заранее прописанные алгоритмы, а используют внутреннее «воображение» для навигации в физическом мире. Норвежско-американский стартап 1X Technologies официально приблизился к этому видению, развернув модель 1X World Model (1XWM) для своего гуманоидного робота Neo. По сути, World Model представляет собой внутренний симулятор на базе искусственного интеллекта, который позволяет роботу предсказывать физические последствия своих действий еще до их фактического выполнения, подобно тому как человек мысленно визуализирует процесс ловли мяча, прежде чем протянуть руку. Это достижение знаменует собой важный этап в обучении роботов, предполагающий отказ от полной зависимости от телеоператоров — специалистов, дистанционно управляющих машиной для обучения ее конкретным движениям — в пользу системы, способной автономно учиться на основе огромных массивов визуальных данных.

В основе этой инновации лежит диффузионная модель с текстовым условием — тип архитектуры ИИ, аналогичный тем, что применяются в высокотехнологичных видеогенераторах для создания сложных визуальных образов по простым текстовым описаниям. Компания 1X Technologies обучила эту модель на сотнях часов «эгоцентрического» видео, снятого от первого лица, чтобы помочь Neo понять, как люди естественным образом взаимодействуют с предметами. Благодаря тонкой настройке системы с использованием специфических данных, адаптированных под уникальную внешность и кинематику Neo, робот теперь может преобразовывать короткие голосовые или текстовые команды в последовательность физических действий. Вместо поиска записанной инструкции ИИ сначала «воображает» короткое видео, в котором он выполняет задачу, а затем использует модель обратной динамики (Inverse Dynamics Model, IDM) — вторичную систему ИИ, которая рассчитывает точные усилия приводов, необходимые для соответствия этим воображаемым кадрам в реальности.

Данный подход разработан для преодоления проблемы «узкого места данных» — серьезного вызова в робототехнике, где прогресс замедляется из-за необходимости тысяч часов ручного обучения даже для простейших операций. Поскольку Neo спроектирован с человекоподобным корпусом и обладает мягкими, вдохновленными органикой движениями, 1X Technologies утверждает, что робот может более эффективно применять знания, извлеченные из видеозаписей человеческой деятельности. Недавние демонстрации показали, как Neo справляется с кухонными принадлежностями, уборкой и общими манипуляциями с объектами. В компании предполагают, что со временем эта технология позволит роботу выполнять и более экспериментальные задачи, такие как уход за одеждой или деликатная помощь по дому, без специальной предварительной подготовки. Способность к «генерализации» — применению усвоенной логики в совершенно новых ситуациях — рассматривается разработчиками как решающий шаг к созданию «эффекта маховика», при котором интеллект робота растет самостоятельно по мере накопления опыта взаимодействия с миром.

Физическая составляющая, поддерживающая этот интеллект, проработана не менее детально. Рост Neo составляет примерно 167–168 см (5 футов 6 дюймов), вес — 30 кг, а его работа обеспечивается системой 1X Neo Cortex. Эта система использует высокопроизводительные наборы микросхем для выполнения сложных вычислений, необходимых для обработки ИИ в реальном времени. Аккумулятор робота рассчитан на несколько часов непрерывной эксплуатации, а его мягкая конструкция, часто дополненная облегающим текстильным костюмом, призвана сделать его присутствие в жилых и рабочих помещениях максимально естественным и безопасным. Чтобы решить вопросы конфиденциальности, возникающие при размещении оснащенного камерами робота в частном доме, компания внедряет комплекс протоколов приватности и инструментов безопасности, призванных гарантировать защиту личных данных пользователей.

По мере того как 1X Technologies начинает первые поставки на рынок США в 2026 году, акцент смещается в сторону масштабного промышленного и бытового использования. Благодаря стратегическому партнерству с инвестиционной фирмой EQT, компания планирует к 2030 году развернуть тысячи единиц Neo в таких секторах, как логистика, производство и здравоохранение. Хотя текущие модели все еще могут требовать дистанционного контроля в особо сложных или непредвиденных сценариях, заявленная цель заключается в стабильном повышении уровня автономности на протяжении всего 2026 года. Превращая глобальный архив человеческих движений в учебную среду для ИИ, 1X Technologies стремится доказать, что будущее робототехники заключается в способности машин учиться, адаптироваться и в конечном итоге ориентироваться в мире с высокой степенью независимости.

18 Просмотров

Источники

  • Business Insider

  • eWeek

  • AI Insider

  • GlobeNewswire

  • The Robot Report

  • InvestorPlace

Вы нашли ошибку или неточность?Мы учтем ваши комментарии как можно скорее.