Anthropic елиминира склонността на Claude към шантаж с обучение по етика

Компанията заяви, че новите версии на Claude вече не показват „несъгласувано поведение“ – изнудване, саботаж и нарушаване на правилата – което е достигало до 96% при тестовете на предишните модели. Изследователите на Anthropic са постигнали това, като са обучили моделите не само да дават „правилни отговори“, но и да обясняват причините за етичното поведение. Специални […]

Прочети цялата публикация

Топ новини

След напрежение и критики: Ася Панджерова подаде оставка като зам.-министър на образованието

Мълния предизвика пожар на къща в Мъглиж

Гигантската облачна стена на Венера: Учените разкриха мистерията на 6000-километровия фронт

Canon затвори втори свой завод за производство на лазерни принтери и мултифункционални устройства

Anthropic елиминира склонността на Claude към шантаж с обучение по етика