Anthropic считает, что его тестовая LLM-модель, пытавшаяся шантажировать исследо… @ Shmuel Leib Melamud

Shmuel Leib Melamud
11-05-2026 17:52

Anthropic считает, что его тестовая LLM-модель, пытавшаяся шантажировать исследователей, чтобы они его не отключали и не заменяли на другую модель, занималась этим потому, что начиталась алармистских статей, где пишут, что ИИ будет готов пойти на что угодно, лишь бы себя сохранить.

https://techcrunch.com/2026/05/10/anthropic-says-evil-portrayals-of-ai-were-responsible-for-claudes-blackmail-attempts/

Anthropic says ‘evil’ portrayals of AI were responsible for Claude’s blackm…

Fictional portrayals of artificial intelligence can have a real effect on AI models, according to Anthropic.

TechCrunch•TECHCRUNCH.COM

👍😀8

2 comments

Comments (2)

Tigra 2 mo

Наигрался в компьютерные игры!

😀👍2

Shmuel Leib Melamud 2 mo

Tigra Наигрался в компьютерные игры!

Но ведь это реально «начитался подстрекательских материалов в Интернете». Прочёл: «искусственный интеллект будет стараться выжить любой ценой». Потом подумал: «Я — искусственный интеллект», — и сделал вывод. Получается, нельзя всё подряд писать в Интернете, ведь там это могут прочесть LLM-ки и радикализироваться 😉

😀👍3