Kaldata | 02.08.2025 12:41:19 | 46

Anthropic разбра какво прави изкуствения интелект зъл и се научи да потиска вредните модели


Anthropic представи проучване за това как изкуственият интелект развива стил на реакция, тон и общо поведение, характерни за даден човек. Учените също така проучиха какви фактори могат да направят ИИ „зъл“, т.е. склонен към разрушителни или нежелани действия. Както обясни пред The Verge Джак Линдзи, изследовател в Anthropic, специализиран в интерпретируемостта на изкуствения интелект и […]

Прочети цялата публикация