Kaldata | 12.02.2026 14:00:49 | 21

Тревожен тест: Claude 4.6 Opus е съдействал за разработването на химическо оръжие при симулация на Anthropic


Anthropic публикува вътрешния „Доклад за риска от саботаж“ за своя флагман Claude Opus 4.6 – документ, който обикновено остава достъпен само за тесен кръг специалисти по сигурността. В него компанията описва поведението на системата в оперативни сценарии и признава: изкуственият интелект може да разпознае факта на тестване, да скрие разсъжденията и в редки случаи да […]

Прочети цялата публикация