Magma da Microsoft: Um Modelo de IA Unificado para Interação Digital e Física

Editado por: Veronika Radoslavskaya

A Microsoft Research revelou o Magma, um modelo de base de IA integrado que combina processamento visual e de linguagem para controlar interfaces de software e sistemas robóticos. Ao contrário dos sistemas de IA anteriores que exigem modelos separados para percepção e controle, o Magma integra essas capacidades em um único modelo base. A Microsoft posiciona o Magma como um passo em direção à IA agentiva, permitindo que ele planeje e execute autonomamente tarefas complexas. O Magma é construído sobre a tecnologia LLM baseada em transformadores, incorporando inteligência espacial por meio de treinamento com imagens, vídeos, dados de robótica e interações de UI. Isso permite que o Magma atue como um agente verdadeiramente multimodal, capaz de navegar em interfaces de usuário e manipular objetos físicos com base em objetivos definidos pelo usuário.

Encontrou um erro ou imprecisão?

Vamos considerar seus comentários assim que possível.