视觉想象力驱动机器人自主化：1X Technologies 如何通过“思维框架”重塑 Neo 人形机器人

13:19, 16 一月

编辑者： Veronika Radoslavskaya

iframe { display: none; }

视觉想象力驱动机器人自主化：1X Technologies 如何通过“思维框架”重塑 Neo 人形机器人

机器人领域正迈向一个全新的时代，机器不再仅仅依赖死板的预设程序，而是开始利用内在的“想象力”来感知和探索物理世界。挪威-美国初创公司 1X Technologies 凭借其为 Neo 人形机器人部署的 1X 世界模型（1XWM），正稳步实现这一愿景。所谓“世界模型”，本质上是一个由人工智能驱动的内部模拟器，它允许机器人在执行动作之前预测其物理后果，这与人类在伸手接球前在大脑中进行视觉预演的过程惊人地相似。这一进展标志着机器人训练方式的重大转变，即从完全依赖人类远程操作员——通过远程控制教授特定动作的专家——转向一个能够从海量视觉数据中自主学习的系统。

这一创新的核心是一种文本条件扩散模型（text-conditioned diffusion model），这种 AI 架构与顶级视频生成器所使用的架构类似，能够根据简单的文字描述创建复杂的视觉内容。1X Technologies 利用数百小时的“第一视角”（egocentric）人类视频对该模型进行了训练，这些素材捕捉了人类自然操作物体的真实过程。通过针对 Neo 独特的视觉外观和运动学特性进行微调，该系统现在可以将简单的语音或文本指令转化为一系列物理动作。AI 不再是寻找预存的指令，而是先“想象”一段自己完成任务的短视频，随后利用逆动力学模型（IDM）——一个计算匹配这些想象画面所需精确电机作用力的二级 AI 系统——在现实中执行该动作。

这种方法旨在解决机器人领域的“数据瓶颈”难题，即即使是简单的任务也需要数千小时的人工培训，这严重拖慢了技术进步。由于 Neo 采用了类人外形以及受生物启发的柔软运动设计，1X Technologies 声称该机器人能够更有效地应用从人类互动视频中获取的知识。在近期的演示中，Neo 展示了处理厨具、清洁和常规物体搬运的能力。公司表示，这项技术最终可以推广到更具实验性的任务中，例如衣物护理或精细的家庭协助，而无需特定的事先培训。这种“泛化”能力——即将学到的逻辑应用于全新场景的能力——被开发者视为创造“飞轮效应”的关键一步，即机器人的智能将随着其对世界体验的增加而自主增长。

支撑这种智能的物理硬件同样精妙。Neo 的身高约为 167 至 168 厘米（约 5 英尺 6 英寸），重量为 30 公斤，由 1X Neo Cortex 系统驱动。该系统利用高性能芯片组来处理实时 AI 运算所需的繁重计算任务。其电池支持数小时的连续运行，而其柔软的设计——通常穿着一件贴身的纺织外套——旨在使其在家庭和专业场所中显得亲和且无威胁。为了应对在家庭中部署带摄像头机器人所带来的隐私担忧，公司正在实施一套隐私协议和安全工具，旨在确保机器人融入家庭环境的同时尊重用户的机密性。

随着 1X Technologies 计划于 2026 年开始向美国市场进行首批交付，其重心正转向大规模的工业和家庭应用。通过与投资机构 EQT 的战略合作，该公司的目标是到 2030 年在物流、制造和医疗保健等领域部署数千台 Neo 机器人。虽然目前的机型在处理高度复杂或意外情况时可能仍需远程监督，但其既定目标是在 2026 年期间稳步提升自主能力。通过将全球人类运动档案转化为 AI 的课堂，1X Technologies 正致力于证明，机器人技术的未来在于机器能够以高度的独立性进行学习、适应并最终在世界中穿行。