Anthropic Confirma Modelo Claude Mythos Tras Fuga de Datos de Ciberseguridad

23:42, 27 marzo

Editado por: Tetiana Pin

Татьяна Пинчук

@Tapin013

·Follow

digitaltoday.co.kr/en/view/43564/…

11:39 PM · Mar 27, 2026

Read more on X

Watch on X

Anthropic Claude. [Foto: Shutterstock]

Anthropic confirmó el 27 de marzo de 2026 la existencia y las pruebas del modelo de inteligencia artificial Claude Mythos, un desarrollo que representa un avance significativo respecto a sus versiones anteriores. La confirmación siguió a una filtración accidental que expuso borradores de contenido no publicado, detallando las capacidades superiores del nuevo sistema. El incidente de seguridad se originó en un repositorio de datos configurado de manera incorrecta y accesible públicamente, lo que evidenció vulnerabilidades en la gestión de información sensible por parte de la compañía.

La exposición abarcó aproximadamente 3,000 borradores de publicaciones de blog y documentación interna vinculada al sistema de gestión de contenido de Anthropic. La corporación atribuyó la divulgación a un "error humano" en la configuración del sistema y procedió a restringir de inmediato el acceso al repositorio comprometido. Los materiales sustraídos describían a Claude Mythos, designado internamente como Capybara, como un modelo que superaba drásticamente a su predecesor, Claude Opus 4.6, en programación de software, razonamiento académico y ciberseguridad. Investigadores como Alexandre Pauwels de la Universidad de Cambridge y Roy Paz de LayerX Security realizaron análisis independientes de los datos extraídos.

La estructura de modelos de Anthropic, que actualmente incluye Opus, Sonnet y Haiku, sugiere que Mythos/Capybara establecería un cuarto nivel de rendimiento y coste superior. Un aspecto central de los archivos filtrados fue el perfil de riesgo de ciberseguridad asociado a Claude Mythos, advirtiendo sobre su capacidad para explotar vulnerabilidades a una escala que podría superar las defensas actuales. Este temor se alinea con las previas advertencias de su Director Ejecutivo, Dario Amodei, sobre el peligro inminente de la inteligencia superhumana, expresadas en su ensayo de enero de 2026, "La Adolescencia de la Tecnología".

Anthropic determinó que un despliegue extremadamente cauteloso era imperativo, limitando el acceso inicial exclusivamente a organizaciones dedicadas a la defensa cibernética. La información fugada también detalló una cumbre a puerta cerrada programada en el Reino Unido, donde Amodei planeaba realizar demostraciones de la tecnología. Este contexto se produce tras el lanzamiento de Claude Opus 4.6 y Sonnet 4.6 en febrero de 2026, y la confirmación de que Opus 4.6 demostró un rendimiento superior a modelos rivales como GPT-5.2. La decisión de priorizar a las entidades de defensa cibernética refleja un reconocimiento explícito de la naturaleza de doble uso de esta tecnología avanzada.

El incidente subraya las brechas en las prácticas de seguridad de datos de los desarrolladores líderes de IA al manejar información preliminar de alta sensibilidad. Además, Anthropic ya había enfrentado problemas de uso indebido, habiendo desarticulado una campaña patrocinada por un estado chino que utilizó capacidades de Claude para infiltrarse en unas 30 organizaciones. La compañía, respaldada por Amazon y Google, también obtuvo una orden judicial para bloquear una prohibición de la Administración Trump sobre el uso gubernamental de su tecnología de IA, argumentando pérdidas financieras significativas.