Back to Timeline
Avatar
Shmuel Leib Melamud

Anthropic считает, что его тестовая LLM-модель, пытавшаяся шантажировать исследователей, чтобы они его не отключали и не заменяли на другую модель, занималась этим потому, что начиталась алармистских статей, где пишут, что ИИ будет готов пойти на что угодно, лишь бы себя сохранить.

https://techcrunch.com/2026/05/10/anthropic-says-evil-portrayals-of-ai-were-responsible-for-claudes-blackmail-attempts/

Anthropic says ‘evil’ portrayals of AI were responsible for Claude’s blackm…
Fictional portrayals of artificial intelligence can have a real effect on AI models, according to Anthropic.
TechCrunchTECHCRUNCH.COM
👍😀8
Comments (2)

Наигрался в компьютерные игры!

👍😀2

Но ведь это реально «начитался подстрекательских материалов в Интернете». Прочёл: «искусственный интеллект будет стараться выжить любой ценой». Потом подумал: «Я — искусственный интеллект», — и сделал вывод. Получается, нельзя всё подряд писать в Интернете, ведь там это могут прочесть LLM-ки и радикализироваться 😉

😀👍3