Magma Microsoft: Model AI Terpadu untuk Interaksi Digital dan Fisik

Diedit oleh: Veronika Radoslavskaya

Microsoft Research telah meluncurkan Magma, model dasar AI terintegrasi yang menggabungkan pemrosesan visual dan bahasa untuk mengendalikan antarmuka perangkat lunak dan sistem robot. Tidak seperti sistem AI sebelumnya yang memerlukan model terpisah untuk persepsi dan kontrol, Magma mengintegrasikan kemampuan ini ke dalam satu model dasar. Microsoft memposisikan Magma sebagai langkah menuju AI agentif, memungkinkannya untuk secara mandiri merencanakan dan menjalankan tugas-tugas kompleks. Magma dibangun di atas teknologi LLM berbasis transformer, menggabungkan kecerdasan spasial melalui pelatihan dengan gambar, video, data robotika, dan interaksi UI. Hal ini memungkinkan Magma untuk bertindak sebagai agen multimodal sejati, yang mampu menavigasi antarmuka pengguna dan memanipulasi objek fisik berdasarkan tujuan yang ditentukan pengguna.

Apakah Anda menemukan kesalahan atau ketidakakuratan?

Kami akan mempertimbangkan komentar Anda sesegera mungkin.