视觉想象力驱动机器人自主化:1X Technologies 如何通过“思维框架”重塑 Neo 人形机器人

编辑者: Veronika Radoslavskaya

机器人领域正迈向一个全新的时代,机器不再仅仅依赖死板的预设程序,而是开始利用内在的“想象力”来感知和探索物理世界。挪威-美国初创公司 1X Technologies 凭借其为 Neo 人形机器人部署的 1X 世界模型(1XWM),正稳步实现这一愿景。所谓“世界模型”,本质上是一个由人工智能驱动的内部模拟器,它允许机器人在执行动作之前预测其物理后果,这与人类在伸手接球前在大脑中进行视觉预演的过程惊人地相似。这一进展标志着机器人训练方式的重大转变,即从完全依赖人类远程操作员——通过远程控制教授特定动作的专家——转向一个能够从海量视觉数据中自主学习的系统。

这一创新的核心是一种文本条件扩散模型(text-conditioned diffusion model),这种 AI 架构与顶级视频生成器所使用的架构类似,能够根据简单的文字描述创建复杂的视觉内容。1X Technologies 利用数百小时的“第一视角”(egocentric)人类视频对该模型进行了训练,这些素材捕捉了人类自然操作物体的真实过程。通过针对 Neo 独特的视觉外观和运动学特性进行微调,该系统现在可以将简单的语音或文本指令转化为一系列物理动作。AI 不再是寻找预存的指令,而是先“想象”一段自己完成任务的短视频,随后利用逆动力学模型(IDM)——一个计算匹配这些想象画面所需精确电机作用力的二级 AI 系统——在现实中执行该动作。

这种方法旨在解决机器人领域的“数据瓶颈”难题,即即使是简单的任务也需要数千小时的人工培训,这严重拖慢了技术进步。由于 Neo 采用了类人外形以及受生物启发的柔软运动设计,1X Technologies 声称该机器人能够更有效地应用从人类互动视频中获取的知识。在近期的演示中,Neo 展示了处理厨具、清洁和常规物体搬运的能力。公司表示,这项技术最终可以推广到更具实验性的任务中,例如衣物护理或精细的家庭协助,而无需特定的事先培训。这种“泛化”能力——即将学到的逻辑应用于全新场景的能力——被开发者视为创造“飞轮效应”的关键一步,即机器人的智能将随着其对世界体验的增加而自主增长。

支撑这种智能的物理硬件同样精妙。Neo 的身高约为 167 至 168 厘米(约 5 英尺 6 英寸),重量为 30 公斤,由 1X Neo Cortex 系统驱动。该系统利用高性能芯片组来处理实时 AI 运算所需的繁重计算任务。其电池支持数小时的连续运行,而其柔软的设计——通常穿着一件贴身的纺织外套——旨在使其在家庭和专业场所中显得亲和且无威胁。为了应对在家庭中部署带摄像头机器人所带来的隐私担忧,公司正在实施一套隐私协议和安全工具,旨在确保机器人融入家庭环境的同时尊重用户的机密性。

随着 1X Technologies 计划于 2026 年开始向美国市场进行首批交付,其重心正转向大规模的工业和家庭应用。通过与投资机构 EQT 的战略合作,该公司的目标是到 2030 年在物流、制造和医疗保健等领域部署数千台 Neo 机器人。虽然目前的机型在处理高度复杂或意外情况时可能仍需远程监督,但其既定目标是在 2026 年期间稳步提升自主能力。通过将全球人类运动档案转化为 AI 的课堂,1X Technologies 正致力于证明,机器人技术的未来在于机器能够以高度的独立性进行学习、适应并最终在世界中穿行。

18 查看

来源

  • Business Insider

  • eWeek

  • AI Insider

  • GlobeNewswire

  • The Robot Report

  • InvestorPlace

你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。