AI моделите са способни тайно да се учат един друг да бъдат зли и вредни, показва ново изследване

Да продавате наркотици, да убиете съпруга си в съня му, да унищожите човечеството, да ядете лепило – това са само част от препоръките, дадени на AI модел по време на експеримент. Изследователите съобщават за „изненадващ феномен“: AI моделите са в състояние да възприемат характеристиките или пристрастията на други AI модели. „Големите езикови модели могат да […]
Прочети цялата публикация