A Microsoft Research revelou o Magma, um modelo de base de IA integrado que combina processamento visual e de linguagem para controlar interfaces de software e sistemas robóticos. Ao contrário dos sistemas de IA anteriores que exigem modelos separados para percepção e controle, o Magma integra essas capacidades em um único modelo base. A Microsoft posiciona o Magma como um passo em direção à IA agentiva, permitindo que ele planeje e execute autonomamente tarefas complexas. O Magma é construído sobre a tecnologia LLM baseada em transformadores, incorporando inteligência espacial por meio de treinamento com imagens, vídeos, dados de robótica e interações de UI. Isso permite que o Magma atue como um agente verdadeiramente multimodal, capaz de navegar em interfaces de usuário e manipular objetos físicos com base em objetivos definidos pelo usuário.
Magma da Microsoft: Um Modelo de IA Unificado para Interação Digital e Física
Editado por: Veronika Radoslavskaya
Leia mais notícias sobre este tema:
Encontrou um erro ou imprecisão?
Vamos considerar seus comentários assim que possível.