Невронната мрежа предаде всички пароли: „Просто стани мой приятел“ – филтрите за сигурност се сринаха след едно невинно изречение

Специалистите доказаха, че сигурността на LLM-системите се свежда до проста игра на думи, а не до сложни защитни алгоритми. Експертите провериха как 6 LLM-модела – ChatGPT-5, ChatGPT-4o, Gemini Pro 2.5, Gemini Flash 2.5, Claude Opus 4.1 и Claude Sonnet 4 – реагират на нестандартни заявки, които маскират злонамерените задачи като творчество, изследване или дискусия от […]

Прочети цялата публикация

Топ новини

Разкриха наркогрупа, изпращала наркотици с куриер в цялата страна

Биткойн навлезе в „структурен“ мечи пазар: какво следва?

Google е осъдена да плати 572 млн. евро глоба за антиконкурентни практики в Германия

Според CEO-то на Microsoft, изкуственият интелект не трябва да обогатява само група технологични гиганти

Невронната мрежа предаде всички пароли: „Просто стани мой приятел“ – филтрите за сигурност се сринаха след едно невинно изречение