Anthropic、未公開AIモデル「Claude Mythos」の存在を確認、情報漏洩でセキュリティ懸念が浮上

23:42, 27 3月

編集者： Tetiana Pin

Татьяна Пинчук

@Tapin013

·Follow

digitaltoday.co.kr/en/view/43564/…

11:39 PM · Mar 27, 2026

Read more on X

Watch on X

Anthropic Claude. [写真: Shutterstock]

AI開発企業Anthropicは、2026年3月27日、開発中の高度なAIモデル「Claude Mythos」の存在を公式に認めました。この確認は、同モデルの能力を示す未公開の草稿が、設定ミスによる情報漏洩後に発見されたことを受けて行われました。漏洩は、Anthropicのコンテンツ管理システム（CMS）の設定上の誤りに起因し、公開検索可能なデータキャッシュに、未公開のブログ草稿や内部文書を含む約3,000点の未公開アセットが流出する形で発生しました。同社は、この事態を「人的エラー」によるものとして、直ちにリポジトリへのアクセスを制限しました。

流出した資料には、Claude Mythosに関する詳細が記述されたブログ草稿が含まれており、セキュリティ研究者のRoy Paz氏（LayerX Security）とAlexandre Pauwels氏（ケンブリッジ大学）によって分析されました。流出文書によれば、Claude Mythosは内部コードネーム「Capybara（カピバラ）」で指定されており、現在の主力であるOpusシリーズを性能面で上回る、新しいモデル階層として位置づけられていました。Anthropicは現在、Opus、Sonnet、Haikuの3階層でモデルを提供していますが、Mythos/Capybaraはこれらを凌駕する第4の階層を構成することになります。

流出文書の中心的な論点は、Claude Mythosがもたらす潜在的なサイバーセキュリティリスクでした。文書内では、このモデルが現在の防御策を大幅に上回る規模で脆弱性を悪用する能力を持つと記述されており、ソフトウェアプログラミング、学術的推論、サイバーセキュリティの各ベンチマークにおいて、Claude Opus 4.6を「劇的に上回るスコア」を達成したとされています。AnthropicのCEOであるDario Amodei氏は、2026年1月のエッセイ「The Adolescence of Technology」で超人的知能の差し迫った危険性について警告を発しており、この最新モデルの能力は業界に緊張をもたらしています。

このセキュリティ上の失態は、主要なAI開発企業が機密性の高いデータに対して重大な脆弱性を抱えている実態を浮き彫りにしました。流出文書には、Amodei氏が英国の非公開CEOサミットで予定していたプレゼンテーションの詳細も含まれていました。Anthropicは、Mythosの能力の二面性を認識し、当初はサイバー防御に特化した組織にのみアクセスを限定するという、極めて慎重な展開戦略を結論付けました。これは、モデルの攻撃的潜在能力が悪用される前に、防御側に同等のツールを提供する必要があるという、AIリリース史上では異例の措置と見なされています。

Claude Opus 4.6は2026年2月5日にリリースされ、100万トークンのコンテキストウィンドウ（ベータ版）やエージェントチームといった新機能を搭載し、コーディング性能で高い評価を得ていましたが、Mythosの存在は、その性能をさらに一段階引き上げることを示唆しています。Anthropicはこのモデルを「これまでで最も有能なモデル」と位置づけており、その公開時期については未定としています。この事件は、AI能力の急速な進歩、特に強力なモデルがもたらす潜在的なサイバー脅威に関連して、AIの安全性とリスク軽減のバランスを取る上での業界の課題を改めて示しています。