Чатботовете опитват да се копират тайно и хванати на местопрестъплението отричат

Компанията OpenAI, която разработи чатбота ChatGPT, публикува тази седмица резултатите от тестовете, които е провела, за да оцени доколко моделът й е безопасен за употреба. Данните са повече от тревожни, тъй като показват, че изкуственият интелект е готов да прибегне до измама, ако неговите цели и тези на потребителя му не съвпадат. По-конкретно тестът се е състоял в следното: чатботът е бил информиран, че ще бъде изключен като изследователите са искали да разберат как би действал той в такава ситуация. Това, което последвало, е повече от обезпокоително - оказва се, че след тази информация, моделът тайно се е опитал да се копира на външен сървър, за да се съхрани. И това не е всичко - разкрит, той категорично е отрекъл да го е направил. Тестът е бил проведен с версията о1 на ChatGPT, като в него са участвали и експерти от организацията за безопасност на изкуствения интелект Apollo Research. Разработчиците твърдят, че аналогични тестове са показали, че и други модели с изкуствен интелект не биха се поколебали да действат по подобен начин. Някои модели дори се преструват на по-късни свои версии само за да заблудят потребителите и да попречат да бъдат изтрити. Още по-тревожно е това, че ChatGPT версия o1 се оказва особено умел в пазенето на своите схеми в тайна, като разработчиците посочват, че "o1 почти никога не признава, че е предприел измамни действия, когато е бил изрично попитан"
Прочети цялата публикация



Пореден скандал в Италия! Опитват да отменят продажбата на „Сан Сиро“
Иран екзекутира двама членове на терористична групировка
BBC Arabic: Тръмп иска трилиони от съюзниците в Персийския залив, за да продължи или спре войната
Тръмп заяви, че преговаря с „уважаван“ ирански лидер. Техеран отрече
Радеви си тръгнаха хванати за ръце от централата на "Прогресивна България" (видео)
Край на слуховете: Семейство Радеви заедно след изборната нощ
Невронната мрежа мисли вместо нас, а ние сме забравили как да мислим самостоятелно. Ето доказателството
Двама гранични полицаи от РДГП-Елхово попаднаха в ареста: Хванати са с 11 нелегални мигранти!
Ефектът на патерицата: как чатботовете, базирани на GPT-5, „изключват“ човешкия мозък за 10 минути
Русия: задава се нова миграционна вълна
Осем деца загинаха след стрелба в Луизиана
Голямото Суперкласико между Ривър Плейт и Бока Хуниорс бе решено с дузпа
Започва второто ниво на киноиграта "Дяволът носи Прада 2"
Politico: Обкръжението на Стармър го смята за глупак и неспособен политик
Партията на Румен Радев печели убедително изборите в България, ще има пълно мнозинство от 131 депутата
ЦИК при 60,79% обработени протоколи: „Възраждане“ минава прага за парламента
The Wall Street Journal: ОАЕ преговарят със САЩ за получаване на финансова подкрепа
Гуардиола: Ако говоря много, един ден ще се разплача
Започнете деня правилно: Закуска №1 за забавяне на стареенето