Anthropic елиминира склонността на Claude към шантаж с обучение по етика

Компанията заяви, че новите версии на Claude вече не показват „несъгласувано поведение“ – изнудване, саботаж и нарушаване на правилата – което е достигало до 96% при тестовете на предишните модели. Изследователите на Anthropic са постигнали това, като са обучили моделите не само да дават „правилни отговори“, но и да обясняват причините за етичното поведение. Специални […]
Прочети цялата публикация



Anthropic привлече съосновател на OpenAI
Унгария иска да се отърве от енергийната зависимост от Москва, но още не се отказва от руския петрол и газ
OpenAI трансформира Codex от инструмент за програмисти в универсален работещ AI-агент
Скандален аудиозапис разтърси Реал Мадрид: Флорентино Перес разкрива заговор за покушение срещу себе си
Wall Street Journal: Малка страна от НАТО се готви за война с Русия
Големият финал в Шампионска лига: ПСЖ или Арсенал ще ликува с трофея
Норвегия взема на прицел Мурманск с южнокорейски ракетни системи
Украинската тенис звезда Елина Свитолина уверено продължава похода си към шести четвъртфинал на "Ролан Гарос"
Мексико Сити отново ще бъде в центъра на световния футбол
Десет от Австрия надвиха минимално Тунис в контрола
Канзас Сити излиза на световната футболна сцена с Мондиал 2026
Турция разгроми с лекота Северна Македония
Районът на залива Сан Франциско ще посрещне Мондиал 2026 с духа на Калифорния
Тръмп: Израел и "Хизбула" спират размяната на удари, войските на Нетаняху се връщат обратно
Украинският външен министър: Украйна е по-полезна за НАТО като член на Алианса, отколкото извън него