Anthropic елиминира склонността на Claude към шантаж с обучение по етика

Компанията заяви, че новите версии на Claude вече не показват „несъгласувано поведение“ – изнудване, саботаж и нарушаване на правилата – което е достигало до 96% при тестовете на предишните модели. Изследователите на Anthropic са постигнали това, като са обучили моделите не само да дават „правилни отговори“, но и да обясняват причините за етичното поведение. Специални […]
Прочети цялата публикация



Унгария иска да се отърве от енергийната зависимост от Москва, но още не се отказва от руския петрол и газ
OpenAI трансформира Codex от инструмент за програмисти в универсален работещ AI-агент
Китай вече има всичко необходимо за обучение на AI на нивото на Claude Mythos, смята шефът на Nvidia
Бритни Спиърс проговори за пръв път след изправянето пред съда (СНИМКА)
Яник Синер срази Попирин и лети към осминафиналите в Рим
НСА отваря врати за кандидат-студенти на 19 май
ChatGPT, Gemini и Claude дадоха различни оценки за това кои професии ще изчезнат заради AI
Отговорът на Claude Mythos: OpenAI пусна AI модела GPT-5.5-Cyber
Димитър Бербатов с подробен отчет за работата си като съветник по младежта и спорта
ОАЕ са световен лидер в използването на изкуствен интелект
Владислав Панев: Инфлацията се дължи на изливането на милиарди от държавата в икономиката
Тодор Неделев премина през успешна операция на коляното
„Прогресивна България“: Съдебната реформа е „най-сериозният проблем“ пред НС
Хората, които правят това всяка седмица, остаряват по-бавно: ново проучване
Избухна взрив край детска градина, евакуираха децата
Турция прави балистична ракета с обсег 6000 км
Започва пръскането срещу комари в Русенско
Иван Иванов стартира ударно на турнира във Вик