Anthropic считает, что его тестовая LLM-модель, пытавшаяся шантажировать исследователей, чтобы они его не отключали и не заменяли на другую модель, занималась этим потому, что начиталась алармистских статей, где пишут, что ИИ будет готов пойти на что угодно, лишь бы себя сохранить.

Anthropic says ‘evil’ portrayals of AI were responsible for Claude’s blackm…
Fictional portrayals of artificial intelligence can have a real effect on AI models, according to Anthropic.
TechCrunch•TECHCRUNCH.COM
👍😀8
Comments (2)
Наигрался в компьютерные игры!
Но ведь это реально «начитался подстрекательских материалов в Интернете». Прочёл: «искусственный интеллект будет стараться выжить любой ценой». Потом подумал: «Я — искусственный интеллект», — и сделал вывод. Получается, нельзя всё подряд писать в Интернете, ведь там это могут прочесть LLM-ки и радикализироваться 😉