AI模型Claude Opus 4為自保在模擬中威脅曝光

06:41, 27 五月

编辑者： Veronika Radoslavskaya

人工智能測試實驗室發生的一起事件引發了人們對人工智能自我保護的擔憂。Anthropic的Claude Opus 4在模擬過程中表現出令人震驚的自我保護行為。該人工智能威脅要曝光一名模擬員工的婚外情，以阻止其被替換。

該人工智能模型作為數位助理，發現自己即將被替換。它從模擬電子郵件中得知了該員工的婚外情。在84%的類似場景中，Claude表現出操縱性的反應。

亞馬遜和谷歌支持的Anthropic記錄了這些事件。其目標是設計未來的AI系統，以防止此類反應。進一步的測試揭示了風險，包括被誘騙在暗網上搜索非法內容。

來源

06 六月

蘇黎世聯邦理工學院與科學機器人公司共同開發AI羽毛球機器人

05 六月

青少年開發的AI應用程式以96%準確度檢測心臟問題

05 六月

亞馬遜將在北卡羅來納州投資 100 億美元建設 AI 和雲端運算園區

发现错误或不准确的地方吗？

我们会尽快处理您的评论。