Los nuevos modelos de IA O3 y O4-Mini de OpenAI muestran tasas de 'alucinación' más altas

09:56, 21 abril

Editado por: Veronika Radoslavskaya

Madrid - Los últimos modelos de IA de OpenAI, O3 y O4-mini, exhiben una tasa más alta de 'alucinaciones' en comparación con sus predecesores. Pruebas internas utilizando la evaluación PersonQA revelaron que estos modelos producen información incorrecta o fabricada con más frecuencia. El modelo O3 alucinó en el 33% de las respuestas, casi el doble de la tasa del modelo O1, mientras que el modelo O4-mini alcanzó una tasa de alucinación del 48%. Estos nuevos modelos están diseñados para tareas como programación, navegación web y generación autónoma de imágenes. A pesar de sus capacidades avanzadas, OpenAI reconoce el problema y está investigando activamente la causa del aumento de las tasas de alucinación. Abordar estas inexactitudes es un área de enfoque continuo para OpenAI, según confirmó el portavoz Niko Felix.

Lea más noticias sobre este tema:

17 abril

OpenAI lanza los modelos O3 y O4-Mini, mejorando el razonamiento de la IA

12 abril

La depuración de código con IA sigue siendo un desafío: Microsoft Research destaca las limitaciones de los modelos de OpenAI y Anthropic

11 abril

OpenAI se prepara para lanzar los mini modelos de IA O3 y O4 en medio del retraso de GPT-5

¿Encontró un error o inexactitud?

Consideraremos sus comentarios lo antes posible.