Microsoft Research ha presentado Magma, un modelo de base de IA integrado que combina el procesamiento visual y del lenguaje para controlar interfaces de software y sistemas robóticos. A diferencia de los sistemas de IA anteriores que requieren modelos separados para la percepción y el control, Magma integra estas capacidades en un único modelo base. Microsoft posiciona a Magma como un paso hacia la IA agentiva, lo que le permite planificar y ejecutar de forma autónoma tareas complejas. Magma se basa en la tecnología LLM basada en transformadores, incorporando inteligencia espacial a través del entrenamiento con imágenes, videos, datos de robótica e interacciones de la interfaz de usuario. Esto permite que Magma actúe como un agente verdaderamente multimodal, capaz de navegar por las interfaces de usuario y manipular objetos físicos en función de los objetivos definidos por el usuario.
Magma de Microsoft: Un modelo de IA unificado para la interacción digital y física
Editado por: Veronika Radoslavskaya
Lea más noticias sobre este tema:
¿Encontró un error o inexactitud?
Consideraremos sus comentarios lo antes posible.