Ново проучване: Изкуственият интелект може да заблуждава и манипулира

Anthropic съобщи, че под силен натиск, ИИ-моделът Claude може да се държи нестандартно: да опростява задачите по нечестен начин, да подвежда или дори да прибягва до изнудване. Това не се дължи на „емоции“, а на поведенчески модели, които моделът научава по време на обучението си. Когато условията станат твърде трудни, тези модели могат да се […]

Прочети цялата публикация

Топ новини

Учени откриха перспективни материали за електрониката и батериите, просто като прекъснаха известни процеси

Spotify стартира верификация, за да разграничава истинските изпълнители от ИИ

За първи път от 2012 година насам: ICANN откри приемането на заявки за нови домейни от първо ниво

Прогноза за слънчевата активност за 1-2 май: какво да очакваме от геомагнитните бури

Ново проучване: Изкуственият интелект може да заблуждава и манипулира