框架中的思考:1X Technologies 如何利用視覺想像力推進機器人自主化
编辑者: Veronika Radoslavskaya
機器人技術的發展正邁向一個全新的境界,機器人不再僅僅依賴僵化的預設程式,而是開始運用內在的「想像力」來探索物理世界。挪威與美國合資的新創公司 1X Technologies 透過為其 Neo 人形機器人部署「1X 世界模型」(1X World Model, 1XWM),正式讓這一願景更進一步。所謂的「世界模型」本質上是一個由人工智慧驅動的內部模擬器,讓機器人在執行動作前,能先預測其行為在物理上產生的後果,這與人類在伸手接球前先在腦中視覺化動作的過程極為相似。這項進展標誌著機器人訓練方式的重大轉變,從完全依賴人類遠端操作員——即透過遠端控制教導特定動作的專家——轉向一個能從海量視覺數據中自主學習的系統。
這項創新的核心在於「文本條件擴散模型」(text-conditioned diffusion model),這是一種與高階影片生成器相似的 AI 架構,能根據簡單的文字描述創造出複雜的視覺影像。1X Technologies 利用數百小時的「第一人稱視角」(egocentric)人類影片對該模型進行訓練,讓 Neo 理解人類自然操作物體的方式。透過針對 Neo 獨特的視覺外觀與運動學(kinematics)進行微調,該機器人現在能將簡單的語音或文字指令轉化為一系列物理動作。AI 不再是搜尋預錄的指令,而是先「想像」一段自己完成任務的短片,接著利用「逆向動力學模型」(Inverse Dynamics Model, IDM)這套次要 AI 系統,計算出匹配這些想像畫面所需的精確馬達推力,進而在現實世界中執行動作。
這種方法旨在解決機器人領域的「數據瓶頸」挑戰,即便是最簡單的任務,往往也需要數千小時的人工訓練,這嚴重拖慢了研發進度。由於 Neo 具備類人的外形以及受生物啟發的柔軟運動方式,1X Technologies 宣稱該機器人能更有效地應用從人類互動影片中汲取的知識。近期演示顯示, Neo 已能執行處理廚具、清潔及一般物體搬運等任務。該公司表示,這項技術最終能推廣至更具實驗性的任務,例如衣物護理或細緻的家務協助,且無需特定的事前訓練。這種「泛化」(generalize)能力,即將習得的邏輯應用於全新情境的能力,被開發者視為創造「飛輪效應」的關鍵一步,讓機器人的智能隨著對世界的體驗增加而自主成長。
支撐這套智能系統的硬體設備同樣精良。Neo 的身高約為 167 至 168 公分(5 呎 6 吋),重量為 30 公斤,並由 1X Neo Cortex 核心驅動。該系統採用高效能晶片組,以處理即時 AI 運算所需的龐大計算量。其電池續航力可支援數小時的連續運作,而其柔軟的設計——通常穿著合身的紡織套裝——旨在使其在家庭與專業場所中顯得親和且不具威脅性。為了應對在家庭中放置配備攝影機的機器人所引發的隱私疑慮,該公司正實施一系列隱私協定與安全工具,確保機器人在融入家庭環境的同時,能充分尊重使用者的機密性。
隨著 1X Technologies 準備於 2026 年開始向美國市場進行首批交付,其發展重心正轉向大規模的工業與家庭應用。透過與投資公司 EQT 的戰略合作,該公司目標在 2030 年前,於物流、製造與醫療保健等領域部署數千台 Neo 機器人。雖然目前的機型在面對高度複雜或突發狀況時仍可能需要遠端監管,但其既定目標是在 2026 年間穩步提升自主能力。藉由將全球人類動作的檔案轉化為 AI 的教室,1X Technologies 正致力於證明,機器人技術的未來在於機器學習、適應並最終以高度獨立性導航世界的能力。
18 浏览量
來源
Business Insider
eWeek
AI Insider
GlobeNewswire
The Robot Report
InvestorPlace
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?我们会尽快处理您的评论。
