Чатботовете вярват в приказките: как приказните светове помагат за хакването на изкуствения интелект

Разкрита е още една неприятна уязвимост на съвременните LLM. Изследователи от екипа Cato CTRL откриха неочаквана уязвимост в работата на съвременните езикови модели. Те са успели да заобиколят защитните механизми на няколко популярни чатбота, включително ChatGPT-4, DeepSeek-R1, DeepSeek-V3 и Microsoft Copilot, без да имат опит в създаването на зловреден софтуер. Експертите са разработили метода „Immersive […]
Прочети цялата публикация



Живеем в епоха на дълбоко геополитическо напрежение и нарастваща несигурност (ВИДЕО)
Как ИИ и STEM променят класната стая: Пето издание на форума „Добрите практики на ФОКУС“
Има ли разлика: как родителите и децата виждат и възприемат изкуствения интелект
Учените предупреждават: човешкият език погрешно приписва съзнание на изкуствения интелект
Ефектът на патерицата: как чатботовете, базирани на GPT-5, „изключват“ човешкия мозък за 10 минути
Бъдещето вече е тук: Изборът на изкуствения интелект и кой го контролира
Grok превзема света: как изкуственият интелект на Илон Мъск спечели чиновници и потребители
Робот с „Ролекс“ подгони стадо диви прасета в Полша
Как Европейският акт за AI ще повлияе на българския бизнес
Тоталната война - кулминацията на путинизма
Карлос Насар триумфира с четвърта европейска титла и вписа името си сред легендите на щангите
Правителството предложи 20 април да бъде обявен за официален празник
Нови правила за матурите: тридневен достъп до проверените работи за всички зрелостници
Нетаняху се лекува от ранен стадий на рак на простатата
"България може" се обявява в защита на ТЕЦ "АЕS Гълъбово"
Готвят стачка в градския транспорт на Варна
Иранският външен министър пристига в Исламабад на фона на очаквания за подновяване на преговорите
YouTube тества нов рекламен формат в стрийминга и дава пълна Multiview свобода на телевизорите
Круз Бекъм подаде ръка на брат си Бруклин в пореден опит за помирение