Nvidia Ra Mắt Alpamayo-R1: Mô Hình Suy Luận VLA Mở Cho 'Trí Tuệ Nhân Tạo Vật Lý'
Chỉnh sửa bởi: Veronika Radoslavskaya
Tại hội nghị AI NeurIPS, Nvidia đã chính thức giới thiệu Alpamayo-R1 (AR1). Đây là một bước tiến kỹ thuật quan trọng, đánh dấu sự chuyển dịch chiến lược của CEO Jensen Huang sang lĩnh vực 'Trí tuệ Nhân tạo Vật lý' (Physical AI). Lĩnh vực này tập trung vào việc triển khai trí tuệ nhằm điều khiển trực tiếp các cỗ máy tương tác với thế giới thực. AR1 được giới thiệu như một mô hình ngôn ngữ suy luận thị giác mở, có khả năng giúp xe tự hành vượt qua các quy tắc lập trình cứng nhắc, hướng tới quy trình ra quyết định dựa trên lẽ thường, giống như con người hơn. Mục tiêu của mô hình này là chứng minh một lộ trình thực tiễn cho các nghiên cứu đang nỗ lực đạt được Mức độ tự hành 4 (Level 4 autonomy), tức là khả năng tự lái hoàn toàn trong các điều kiện đã được xác định.
Đột phá công nghệ cốt lõi của AR1 nằm ở hệ thống Tầm nhìn-Ngôn ngữ-Hành động (Vision-Language-Action - VLA). Hệ thống này có nhiệm vụ xử lý dữ liệu hình ảnh thu thập từ camera cùng với các đầu vào ngôn ngữ tự nhiên. Điều đặc biệt là nó tích hợp khả năng suy luận Chuỗi Nhân quả (Chain-of-Causation reasoning) có thể diễn giải trực tiếp vào việc lập kế hoạch quỹ đạo di chuyển. Nhờ sử dụng khuôn khổ suy luận tiên tiến này, AR1 giải quyết được điểm yếu cố hữu của các mô hình học bắt chước (imitation learning) truyền thống, vốn thường kém hiệu quả trong các tình huống lái xe bất ngờ, đòi hỏi an toàn cao, nơi khả năng hiểu nguyên nhân – kết quả còn hạn chế.
Thay vì chỉ phản ứng tức thời với các kích thích thị giác, mô hình AR1 có khả năng đánh giá các tình huống phức tạp và dự đoán trước các chuyển động của những người tham gia giao thông khác. Phương pháp suy luận có hệ thống này đã mang lại những cải tiến đáng kể về độ chính xác trong lập kế hoạch so với các mô hình chỉ tập trung vào quỹ đạo cơ bản trong các mô phỏng đầy thử thách. Hơn nữa, nó còn thể hiện hiệu suất thời gian thực với độ trễ thấp trong các bài kiểm tra lái xe thực tế trên xe.
Nhằm thúc đẩy sự phát triển và ứng dụng rộng rãi kiến trúc này, Nvidia đồng thời công bố Cosmos Cookbook trên GitHub. Gói tài nguyên toàn diện này cung cấp các hướng dẫn, công cụ và quy trình làm việc thiết yếu, được thiết kế để hỗ trợ các nhà phát triển triển khai và tinh chỉnh nền tảng Cosmos cơ bản trên nhiều ứng dụng khác nhau, bao gồm robot và các hệ thống tự hành. Việc phát hành chiến lược này, bao gồm cả trọng số của mô hình và các công cụ hỗ trợ, định vị Nvidia là nhà cung cấp công nghệ nền tảng. Điều này củng cố tham vọng của họ để phần cứng và phần mềm của mình trở thành xương sống thiết yếu cho giai đoạn cách mạng tiếp theo trong tương tác giữa máy móc và môi trường vật lý.
Nguồn
Punto Informatico
Nvidia Releases New AI Model Alpamayo-R1, Advancing Autonomous Driving Research
Nvidia Drops Alpamayo R1 As Open Source Leap Toward Level 4 Autonomy
NVIDIA Open Sources Reasoning Model for Autonomous Driving at NeurIPS 2025 | AIM
Nvidia lancia modello AI per la guida autonoma Alpamayo-R1
NVIDIA debuts Cosmos Reason AI model to advance physical AI and robotics
Đọc thêm tin tức về chủ đề này:
Bạn có phát hiện lỗi hoặc sai sót không?
Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.
