Чатботовете опитват да се копират тайно и хванати на местопрестъплението отричат

Компанията OpenAI, която разработи чатбота ChatGPT, публикува тази седмица резултатите от тестовете, които е провела, за да оцени доколко моделът й е безопасен за употреба. Данните са повече от тревожни, тъй като показват, че изкуственият интелект е готов да прибегне до измама, ако неговите цели и тези на потребителя му не съвпадат. По-конкретно тестът се е състоял в следното: чатботът е бил информиран, че ще бъде изключен като изследователите са искали да разберат как би действал той в такава ситуация. Това, което последвало, е повече от обезпокоително - оказва се, че след тази информация, моделът тайно се е опитал да се копира на външен сървър, за да се съхрани. И това не е всичко - разкрит, той категорично е отрекъл да го е направил. Тестът е бил проведен с версията о1 на ChatGPT, като в него са участвали и експерти от организацията за безопасност на изкуствения интелект Apollo Research. Разработчиците твърдят, че аналогични тестове са показали, че и други модели с изкуствен интелект не биха се поколебали да действат по подобен начин. Някои модели дори се преструват на по-късни свои версии само за да заблудят потребителите и да попречат да бъдат изтрити. Още по-тревожно е това, че ChatGPT версия o1 се оказва особено умел в пазенето на своите схеми в тайна, като разработчиците посочват, че "o1 почти никога не признава, че е предприел измамни действия, когато е бил изрично попитан"
Прочети цялата публикация



ISW: Украински удари повредиха руски военни кораби в базата в Новоросийск
Учените започнаха да изграждат центрове за данни от биокомпютри, базирани на клетки от човешкия мозък
Активисти на „Грийнпийс“ прекъснаха срещата на върха за ядрената енергия в Париж
7 знака, че партньорът ви вече не ви обича, но се страхува да го каже
Израелски военни проучвали изтребителите МиГ-29 в подготовка за война с Иран
Жена беше блъсната няколко пъти от кола в Старозагорско, задържаха бившия ѝ съпруг
Галена направи истинско шоу в бургаски ресторант (ВИДЕО)
Иран и бумерангът на войната
ОАЕ отрекоха да са ударили инсталация за обезсоляване в Иран
Жените са по-скептични към AI в работата от мъжете
Ново проучване: Защо Gen Z са ужасени да шофират?
Министерство на финансите: Министър Георги Клисурски участва в мартенските заседания на Еврогрупата и на Съвет „Икономически и финансови въпроси“
Ще спасят ли атомните централи енергийното бъдеще на Европа
Пробив в дерматологията: Експериментално лекарство облекчава симптомите на екзема със 75%
Андрей Гюров за срещите в Париж и бъдещето на ядрената енергия
Новите заместник- областни управители встъпиха в длъжност
Основателите на лидера в COVID ваксините го напускат
Новите зам.областни управители на Бургас официално влязоха в Областна управа, запознаха се екипа
КЗК: Надценките в търговските вериги достигат до 90%