Как да заблудите DeepSeek? Три техники за „хакване“ на китайския изкуствен интелект

Изследователи на Palo Alto Networks от подразделението Unit 42 са установили уязвимости в големите езикови модели на DeepSeek, които им позволяват да заобиколят механизмите им за сигурност и да ги принудят да доставят забранено съдържание. Използвайки три техники, наречени Deceptive Delight, Bad Likert Judge и Crescendo те са успели да постигнат високи нива на защита, […]

Прочети цялата публикация

Топ новини

Сам Алтман разкри една от големите грешки на OpenAI

Тим Кук е впечатлен от Deepseek

Тайванските власти ще помогнат на Foxconn и други компании да се справят с новите американски мита

NordVPN представи нов протокол, който може да направи VPN връзките напълно незабележими

Как да заблудите DeepSeek? Три техники за „хакване“ на китайския изкуствен интелект