Tư duy qua từng khung hình: Cách 1X Technologies sử dụng trí tưởng tượng thị giác để thúc đẩy quyền tự chủ của robot

Chỉnh sửa bởi: Veronika Radoslavskaya

Lĩnh vực robot đang tiến tới một tương lai nơi máy móc không còn phụ thuộc vào các kịch bản cứng nhắc được lập trình sẵn, mà thay vào đó là sử dụng một "trí tưởng tượng" nội tại để điều hướng thế giới vật lý. Công ty khởi nghiệp Na Uy-Mỹ 1X Technologies đã chính thức tiến gần hơn tới tầm nhìn này với việc triển khai Mô hình Thế giới 1X (1XWM) cho robot hình người Neo. Về bản chất, Mô hình Thế giới là một bộ mô phỏng nội bộ dựa trên AI, cho phép robot dự đoán các hệ quả vật lý từ hành động của mình trước khi thực hiện chúng, tương tự như cách con người hình dung việc bắt một quả bóng trước khi đưa tay ra. Sự phát triển này đánh dấu một bước chuyển mình trong cách đào tạo robot, rời xa sự phụ thuộc hoàn toàn vào các kỹ thuật viên điều khiển từ xa để hướng tới một hệ thống tự học hỏi từ lượng dữ liệu thị giác khổng lồ.

Trọng tâm của sự đổi mới này là mô hình khuếch tán điều kiện văn bản (text-conditioned diffusion model), một loại kiến trúc AI tương tự như kiến trúc được sử dụng trong các trình tạo video cao cấp có khả năng tạo ra hình ảnh phức tạp từ các mô tả bằng văn bản đơn giản. 1X Technologies đã huấn luyện mô hình này trên hàng trăm giờ video "tự thân" (egocentric) của con người — những thước phim được quay từ góc nhìn thứ nhất — để giúp Neo hiểu cách con người thao tác với các vật thể một cách tự nhiên. Bằng cách tinh chỉnh hệ thống này với dữ liệu robot cụ thể phù hợp với ngoại hình và động học độc đáo của Neo, robot hiện có thể chuyển đổi một lệnh bằng giọng nói hoặc văn bản đơn giản thành một chuỗi các chuyển động vật lý. Thay vì tìm kiếm một hướng dẫn được ghi lại sẵn, AI trước tiên sẽ "tưởng tượng" một đoạn video ngắn về việc mình hoàn thành nhiệm vụ và sau đó sử dụng Mô hình Động lực học Nghịch đảo (IDM) — một hệ thống AI phụ trợ giúp tính toán chính xác lực động cơ cần thiết — để thực hiện hành động trong đời thực dựa trên những hình ảnh đã hình dung.

Phương pháp tiếp cận này được thiết kế để giải quyết "nút thắt cổ chai dữ liệu", một thách thức đáng kể trong lĩnh vực robot khi tiến độ bị chậm lại bởi hàng nghìn giờ đào tạo thủ công cho ngay cả những nhiệm vụ đơn giản nhất. Vì Neo được chế tạo với hình dáng giống người và các chuyển động mềm mại lấy cảm hứng từ hữu cơ, 1X Technologies khẳng định robot có thể áp dụng hiệu quả hơn những kiến thức thu thập được từ video về việc con người tương tác với môi trường xung quanh. Các buổi trình diễn gần đây đã cho thấy Neo thực hiện các công việc như xử lý đồ dùng nhà bếp, dọn dẹp và thao tác vật thể nói chung. Công ty gợi ý rằng công nghệ này cuối cùng có thể khái quát hóa cho các nhiệm vụ thử nghiệm hơn, chẳng hạn như chăm sóc quần áo hoặc hỗ trợ gia đình một cách tinh tế mà không cần đào tạo cụ thể trước đó. Khả năng "khái quát hóa" này được các nhà phát triển coi là bước đi quan trọng để tạo ra "hiệu ứng bánh đà", nơi trí thông minh của robot phát triển tự chủ khi nó trải nghiệm thế giới nhiều hơn.

Phần cứng vật lý hỗ trợ trí thông minh này cũng tinh vi không kém. Neo cao khoảng 167–168 cm (5'6"), nặng 30 kg và được vận hành bởi hệ thống 1X Neo Cortex. Hệ thống này sử dụng các bộ vi xử lý hiệu suất cao để xử lý các tác vụ tính toán nặng nề cần thiết cho quá trình AI thời gian thực. Pin của nó cho phép hoạt động liên tục trong vài giờ, và thiết kế mềm mại — thường thấy trong bộ đồ dệt may ôm sát — nhằm mục đích biến nó thành một sự hiện diện không gây đe dọa trong không gian gia đình và chuyên nghiệp. Để giải quyết các lo ngại về quyền riêng tư vốn có khi đặt một robot trang bị camera trong nhà, công ty đang triển khai một bộ giao thức bảo mật và công cụ an ninh được thiết kế để đảm bảo rằng việc tích hợp robot vào môi trường gia đình luôn tôn trọng tính bảo mật của người dùng.

Khi 1X Technologies bắt đầu những đợt giao hàng đầu tiên tới thị trường Hoa Kỳ vào năm 2026, trọng tâm đang chuyển sang tiện ích công nghiệp và gia đình quy mô lớn. Thông qua quan hệ đối tác chiến lược với công ty đầu tư EQT, công ty đặt mục tiêu triển khai hàng nghìn đơn vị Neo trên các lĩnh vực như hậu cần, sản xuất và chăm sóc sức khỏe vào năm 2030. Mặc dù các đơn vị hiện tại vẫn có thể sử dụng sự giám sát từ xa cho các tình huống cực kỳ phức tạp hoặc bất ngờ, mục tiêu đề ra là tăng dần mức độ khả năng tự chủ trong suốt năm 2026. Bằng cách biến kho lưu trữ chuyển động của con người toàn cầu thành một lớp học cho AI, 1X Technologies đang nỗ lực chứng minh rằng tương lai của ngành robot nằm ở khả năng học hỏi, thích nghi và cuối cùng là điều hướng thế giới với mức độ độc lập cao của máy móc.

18 Lượt xem

Nguồn

  • Business Insider

  • eWeek

  • AI Insider

  • GlobeNewswire

  • The Robot Report

  • InvestorPlace

Bạn có phát hiện lỗi hoặc sai sót không?Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.