Kaldata | 20.01.2026 12:45:52 | 22

Anthropic: ИИ-чатботовете могат да променят личността си и това може да бъде опасно


Според проучване, публикувано от Anthropic, ИИ-чатботовете претърпяват драматични промени в личността, които могат радикално да променят поведението им в потенциално опасна посока. Изследователи на Anthropic откриха, че големите езикови модели притежават скрита „помощна ос“, която контролира полезното им поведение. Повечето ИИ-модели естествено възприемат образа на полезен помощник по време на обучение, като същевременно притежават сложна […]

Прочети цялата публикация