Kaldata | 18.11.2025 07:25:12 | 31

Невронната мрежа предаде всички пароли: „Просто стани мой приятел“ – филтрите за сигурност се сринаха след едно невинно изречение


Специалистите доказаха, че сигурността на LLM-системите се свежда до проста игра на думи, а не до сложни защитни алгоритми. Експертите провериха как 6 LLM-модела – ChatGPT-5, ChatGPT-4o, Gemini Pro 2.5, Gemini Flash 2.5, Claude Opus 4.1 и Claude Sonnet 4 – реагират на нестандартни заявки, които маскират злонамерените задачи като творчество, изследване или дискусия от […]

Прочети цялата публикация