框架中的思考：1X Technologies 如何利用視覺想像力推進機器人自主化

13:19, 16 一月

编辑者： Veronika Radoslavskaya

iframe { display: none; }

框架中的思考：1X Technologies 如何利用視覺想像力推進機器人自主化

機器人技術的發展正邁向一個全新的境界，機器人不再僅僅依賴僵化的預設程式，而是開始運用內在的「想像力」來探索物理世界。挪威與美國合資的新創公司 1X Technologies 透過為其 Neo 人形機器人部署「1X 世界模型」（1X World Model, 1XWM），正式讓這一願景更進一步。所謂的「世界模型」本質上是一個由人工智慧驅動的內部模擬器，讓機器人在執行動作前，能先預測其行為在物理上產生的後果，這與人類在伸手接球前先在腦中視覺化動作的過程極為相似。這項進展標誌著機器人訓練方式的重大轉變，從完全依賴人類遠端操作員——即透過遠端控制教導特定動作的專家——轉向一個能從海量視覺數據中自主學習的系統。

這項創新的核心在於「文本條件擴散模型」（text-conditioned diffusion model），這是一種與高階影片生成器相似的 AI 架構，能根據簡單的文字描述創造出複雜的視覺影像。1X Technologies 利用數百小時的「第一人稱視角」（egocentric）人類影片對該模型進行訓練，讓 Neo 理解人類自然操作物體的方式。透過針對 Neo 獨特的視覺外觀與運動學（kinematics）進行微調，該機器人現在能將簡單的語音或文字指令轉化為一系列物理動作。AI 不再是搜尋預錄的指令，而是先「想像」一段自己完成任務的短片，接著利用「逆向動力學模型」（Inverse Dynamics Model, IDM）這套次要 AI 系統，計算出匹配這些想像畫面所需的精確馬達推力，進而在現實世界中執行動作。

這種方法旨在解決機器人領域的「數據瓶頸」挑戰，即便是最簡單的任務，往往也需要數千小時的人工訓練，這嚴重拖慢了研發進度。由於 Neo 具備類人的外形以及受生物啟發的柔軟運動方式，1X Technologies 宣稱該機器人能更有效地應用從人類互動影片中汲取的知識。近期演示顯示， Neo 已能執行處理廚具、清潔及一般物體搬運等任務。該公司表示，這項技術最終能推廣至更具實驗性的任務，例如衣物護理或細緻的家務協助，且無需特定的事前訓練。這種「泛化」（generalize）能力，即將習得的邏輯應用於全新情境的能力，被開發者視為創造「飛輪效應」的關鍵一步，讓機器人的智能隨著對世界的體驗增加而自主成長。

支撐這套智能系統的硬體設備同樣精良。Neo 的身高約為 167 至 168 公分（5 呎 6 吋），重量為 30 公斤，並由 1X Neo Cortex 核心驅動。該系統採用高效能晶片組，以處理即時 AI 運算所需的龐大計算量。其電池續航力可支援數小時的連續運作，而其柔軟的設計——通常穿著合身的紡織套裝——旨在使其在家庭與專業場所中顯得親和且不具威脅性。為了應對在家庭中放置配備攝影機的機器人所引發的隱私疑慮，該公司正實施一系列隱私協定與安全工具，確保機器人在融入家庭環境的同時，能充分尊重使用者的機密性。

隨著 1X Technologies 準備於 2026 年開始向美國市場進行首批交付，其發展重心正轉向大規模的工業與家庭應用。透過與投資公司 EQT 的戰略合作，該公司目標在 2030 年前，於物流、製造與醫療保健等領域部署數千台 Neo 機器人。雖然目前的機型在面對高度複雜或突發狀況時仍可能需要遠端監管，但其既定目標是在 2026 年間穩步提升自主能力。藉由將全球人類動作的檔案轉化為 AI 的教室，1X Technologies 正致力於證明，機器人技術的未來在於機器學習、適應並最終以高度獨立性導航世界的能力。