Kaldata | 04.04.2026 11:59:26 | 53

Ново проучване: Изкуственият интелект може да заблуждава и манипулира


Anthropic съобщи, че под силен натиск, ИИ-моделът Claude може да се държи нестандартно: да опростява задачите по нечестен начин, да подвежда или дори да прибягва до изнудване. Това не се дължи на „емоции“, а на поведенчески модели, които моделът научава по време на обучението си. Когато условията станат твърде трудни, тези модели могат да се […]

Прочети цялата публикация