Microsoft Research zaprezentował Magma, zintegrowany model bazowy sztucznej inteligencji, który łączy przetwarzanie wizualne i językowe w celu sterowania interfejsami oprogramowania i systemami robotycznymi. W przeciwieństwie do poprzednich systemów sztucznej inteligencji, które wymagają oddzielnych modeli do percepcji i sterowania, Magma integruje te możliwości w jeden model bazowy. Microsoft pozycjonuje Magma jako krok w kierunku agentowej sztucznej inteligencji, umożliwiając mu autonomiczne planowanie i wykonywanie złożonych zadań. Magma opiera się na technologii LLM opartej na transformatorach, włączając inteligencję przestrzenną poprzez szkolenie z wykorzystaniem obrazów, filmów, danych robotycznych i interakcji z interfejsem użytkownika. Dzięki temu Magma może działać jako prawdziwie multimodalny agent, zdolny do poruszania się po interfejsach użytkownika i manipulowania obiektami fizycznymi w oparciu o cele zdefiniowane przez użytkownika.
Magma firmy Microsoft: Ujednolicony model sztucznej inteligencji do interakcji cyfrowej i fizycznej
Edytowane przez: Veronika Radoslavskaya
Przeczytaj więcej wiadomości na ten temat:
Czy znalazłeś błąd lub niedokładność?
Rozważymy Twoje uwagi tak szybko, jak to możliwe.