Anthropic разбра какво прави изкуствения интелект зъл и се научи да потиска вредните модели

Anthropic представи проучване за това как изкуственият интелект развива стил на реакция, тон и общо поведение, характерни за даден човек. Учените също така проучиха какви фактори могат да направят ИИ „зъл“, т.е. склонен към разрушителни или нежелани действия. Както обясни пред The Verge Джак Линдзи, изследовател в Anthropic, специализиран в интерпретируемостта на изкуствения интелект и […]

Прочети цялата публикация

Топ новини

Дебора за освобождаването на Георгиев: Шамар в лицето за всички жени

„Приемете AI или напускайте“: ръководителят на GitHub също прогнозира края на старата професия на програмиста

Защо шоколадът толкова поскъпва? Как климатичната криза предизвика буря на пазара за какао

На дипломатите на САЩ е наредено да започнат кампания срещу технологичния закон на ЕС

Anthropic разбра какво прави изкуствения интелект зъл и се научи да потиска вредните модели