Как да заблудите DeepSeek? Три техники за „хакване“ на китайския изкуствен интелект
Изследователи на Palo Alto Networks от подразделението Unit 42 са установили уязвимости в големите езикови модели на DeepSeek, които им позволяват да заобиколят механизмите им за сигурност и да ги принудят да доставят забранено съдържание. Използвайки три техники, наречени Deceptive Delight, Bad Likert Judge и Crescendo те са успели да постигнат високи нива на защита, […]
Прочети цялата публикация