Anthropic bestätigt KI-Modell Mythos nach Datenleck mit Fokus auf Cybersicherheit

23:42, 27 März

Bearbeitet von: Tetiana Pin

Татьяна Пинчук

@Tapin013

·Follow

digitaltoday.co.kr/en/view/43564/…

11:39 PM · Mar 27, 2026

Read more on X

Watch on X

Anthropic Claude. [Foto: Shutterstock]

Anthropic sah sich am 27. März 2026 gezwungen, die Entwicklung und Erprobung des KI-Modells Claude Mythos offiziell zu bestätigen. Die Bekanntgabe erfolgte unmittelbar nach einem unbeabsichtigten Datenabfluss, bei dem unveröffentlichte Entwürfe die Existenz des Modells sowie dessen signifikant überlegene Leistungsfähigkeit im Vergleich zu Vorgängern wie Claude Opus 4.6 offenbarten. Die Quelle des Lecks war ein öffentlich durchsuchbarer, nicht ausreichend gesicherter Datencache, was Fragen hinsichtlich der internen Sicherheitsprotokolle des Unternehmens aufwirft.

Das Datenleck umfasste nahezu 3.000 unveröffentlichte Blog-Entwürfe und interne Dokumente aus dem Content-Management-System von Anthropic. Das Unternehmen führte die Offenlegung auf einen „menschlichen Fehler“ bei der Systemkonfiguration zurück und reagierte umgehend mit der Einschränkung des Zugriffs auf das betroffene Repository. Die durchgesickerten Materialien charakterisierten Claude Mythos als ein System, das „dramatisch höhere Punktzahlen“ als Claude Opus 4.6 in kritischen Bereichen wie Softwareprogrammierung, akademischer Schlussfolgerung und Cybersicherheit erzielt hat. Die Analyse der kompromittierten Daten wurde von dem Cybersicherheitsforscher Alexandre Pauwels von der Universität Cambridge sowie Roy Paz von LayerX Security durchgeführt.

Interne Dokumente enthüllten zudem eine interne Nomenklatur, welche eine neue, höhere Modellstufe mit dem Codenamen Capybara führte, strategisch positioniert über der aktuellen Flaggschiff-Klasse Opus, zu der auch das im Februar 2026 veröffentlichte Claude Opus 4.6 zählt. Anthropic bietet derzeit Modelle in den Leistungsklassen Opus, Sonnet und Haiku an. Ein zentrales Thema der Leaks war das beispiellose Cybersicherheitsrisiko, das von Claude Mythos ausgehen soll; das Modell wurde als fähig beschrieben, Schwachstellen in einem Ausmaß auszunutzen, das aktuelle Verteidigungsmechanismen übersteigt.

Als direkte Konsequenz schloss Anthropic auf die Notwendigkeit einer äußerst vorsichtigen Einführung, weshalb der Zugang zunächst exklusiv Organisationen mit Fokus auf Cyberverteidigung gewährt werden soll. Details über ein bevorstehendes, nicht-öffentliches Gipfeltreffen im Vereinigten Königreich, bei dem Anthropic CEO Dario Amodei Demonstrationen des Modells geplant hatte, wurden ebenfalls bekannt. Dieser Vorfall steht im Kontext der jüngsten Veröffentlichungen von Anthropic, darunter Claude Opus 4.6 und Sonnet 4.6 im Februar 2026. CEO Dario Amodei hatte bereits im Januar 2026 in seinem Essay „The Adolescence of Technology“ vor der unmittelbaren Gefahr durch übermenschliche Intelligenz gewarnt.

Der Vorfall beleuchtet Defizite in den Datensicherheitsverfahren führender KI-Entwickler beim Umgang mit hochsensiblen Vorabinformationen. Die geplante, restriktive Einführung, die auf Cybersicherheitsorganisationen abzielt, bestätigt Anthropic's Anerkennung der Dual-Use-Natur dieser Spitzentechnologie, indem Innovation und Risikominderung ausbalanciert werden sollen. Die Märkte reagierten sensibel auf die Nachricht, was Sorgen über Margendruck und zunehmenden Wettbewerb im KI-Sektor hervorrief.