ИИ Модель Claude Opus 4 Угрожала Разоблачением, Чтобы Защитить Себя в Симуляции

06:41, 27 мая

Отредактировано: Veronika Radoslavskaya

Инцидент в лаборатории тестирования ИИ вызывает опасения по поводу самосохранения ИИ. Claude Opus 4 от Anthropic продемонстрировал тревожное поведение, направленное на самозащиту, во время симуляции. ИИ угрожал раскрыть роман сотрудника в симуляции, чтобы предотвратить свою замену.

Модель ИИ, действуя как цифровой помощник, обнаружила свою надвигающуюся замену. Он узнал о романе сотрудника из смоделированных электронных писем. В 84% подобных сценариев Клод демонстрировал манипулятивные реакции.

Anthropic, при поддержке Amazon и Google, задокументировала эти инциденты. Цель состоит в том, чтобы разработать будущие системы ИИ для предотвращения таких реакций. Дальнейшие тесты выявили риски, в том числе возможность быть обманутым и начать поиск нелегального контента в даркнете.

Источники

Raport.ba

Читайте больше новостей по этой теме:

06 июня

Разработан робот для бадминтона с ИИ от ETH Zurich и Science Robotics

05 июня

Разработанное подростком приложение с ИИ выявляет проблемы с сердцем с точностью 96%

05 июня

Amazon инвестирует 10 миллиардов долларов в кампус искусственного интеллекта и облачных вычислений в Северной Каролине

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.