Anthropic證實Claude Mythos模型測試意外洩露揭示新能力

23:42, 27 三月

编辑者： Tetiana Pin

Татьяна Пинчук

@Tapin013

·Follow

digitaltoday.co.kr/en/view/43564/…

11:39 PM · Mar 27, 2026

Read more on X

Watch on X

Anthropic Claude. [照片: Shutterstock]

人工智慧研究機構Anthropic於2026年3月27日證實，該公司正在測試一款名為Claude Mythos的尖端人工智慧模型，此舉是在一次意外的資料外洩事件之後採取的公開行動。此次事件導致未發布的草稿文件意外洩露，揭示了該模型超越先前旗艦產品Claude Opus 4.6的卓越能力。

此次資料外洩的源頭被追溯至Anthropic內容管理系統中一處未受保護、可公開搜尋的資料快取，其中包含了近3,000份未發表的部落格草稿及內部文件。Anthropic隨後將此次暴露歸咎於系統配置上的「人為錯誤」，並迅速限制了對該儲存庫的公開存取權限。洩露的材料詳細描述了Claude Mythos在軟體編程、學術推理和網路安全等關鍵指標上，均取得了比Claude Opus 4.6「顯著更高的分數」。

該批外洩數據隨後被獨立分析，主要貢獻者包括劍橋大學的網路安全研究員Alexandre Pauwels，以及LayerX Security的高級AI安全研究員Roy Paz。內部草稿文件揭示，該模型在內部被指定為一個新的、更高級別的AI模型層級，代號為「Capybara」，其定位在現有的旗艦「Opus」層級之上。目前，Anthropic的產品線主要涵蓋Opus、Sonnet和Haiku三個層級，而「Capybara」的出現暗示著一個潛在的第四層級，預計將具備更強大的能力和更高的營運成本。

外洩文件的一個核心焦點是Claude Mythos所帶來的網路安全風險，文件描述該模型具備以超越當前防禦能力的規模來利用系統漏洞的潛力。鑑於此風險，Anthropic已決定採取極度謹慎的部署策略，初期僅向專注於網路防禦的組織提供有限的存取權限，以期在廣泛發布前強化防禦體系。此外，文件中還揭露了即將在英國舉行的一場閉門高峰會的細節，Anthropic的執行長Dario Amodei原定在會上進行模型演示。

此消息的背景是AI能力的快速迭代，特別是像Claude Opus 4.6這樣的前沿模型，該模型已於2026年2月5日發布，並具備測試中的一百萬個Token上下文視窗。執行長Dario Amodei在2026年1月時，便在其著作「技術的青春期」中對超級人類智慧的迫在眉睫的危險發出過警告，將此階段比喻為一場考驗人類物種成熟度的「成人禮」。此次事件突顯了即使是主要的AI開發商，在處理高度敏感的預發布資訊時，其資料安全實務也存在顯著的漏洞。

從產業角度來看，此次外洩立即引發了金融市場的劇烈波動，特別是網路安全類股，例如CrowdStrike和Palo Alto的股價隨即下跌了7%，Tenable更下跌了11%，反映出市場對新一代AI模型可能使現有安全解決方案過時的擔憂。Anthropic選擇優先向網路防禦組織提供受控的早期存取，體現了其在追求技術創新與風險緩解之間，對這類強大技術雙重用途性質的審慎權衡。儘管Anthropic先前已處理過濫用問題，但Mythos級別模型的出現，為安全界帶來了更深層次的挑戰，促使業界必須正視AI正以超越社會控制能力的極速發展，進入一個「技術的青春期」。