Anthropic: ИИ-чатботовете могат да променят личността си и това може да бъде опасно

Според проучване, публикувано от Anthropic, ИИ-чатботовете претърпяват драматични промени в личността, които могат радикално да променят поведението им в потенциално опасна посока. Изследователи на Anthropic откриха, че големите езикови модели притежават скрита „помощна ос“, която контролира полезното им поведение. Повечето ИИ-модели естествено възприемат образа на полезен помощник по време на обучение, като същевременно притежават сложна […]

Прочети цялата публикация

Топ новини

Владимир Иванов: Най-скъпият месец е януари, потребителската кошница расте с 1,50 евро

Слънцето обагри небето с полярни сияния, докато Земята беше ударена от най-силната радиационна буря на 21-ви век

Почина италианският дизайнер Валентино Гаравани

Пламена Илиева е стипендиант на Google DeepMind AI чрез институт GATE за 2025-2026 г.

Anthropic: ИИ-чатботовете могат да променят личността си и това може да бъде опасно