Чатботовете вярват в приказките: как приказните светове помагат за хакването на изкуствения интелект

Разкрита е още една неприятна уязвимост на съвременните LLM. Изследователи от екипа Cato CTRL откриха неочаквана уязвимост в работата на съвременните езикови модели. Те са успели да заобиколят защитните механизми на няколко популярни чатбота, включително ChatGPT-4, DeepSeek-R1, DeepSeek-V3 и Microsoft Copilot, без да имат опит в създаването на зловреден софтуер. Експертите са разработили метода „Immersive […]
Прочети цялата публикация