Изкуственият интелект също показва признаци на стареене и когнитивен упадък

Изкуственият интелект (AI) все по-често се използва за медицинска диагностика, благодарение на способността си да открива аномалии и предупредителни сигнали в медицинската история, рентгенови изображения и други бази данни, още преди те да станат очевидни за човешкото око. Въпреки това, ново изследване, публикувано на 20 декември 2024 г. в BMJ, повдига въпроса дали технологии като големите езикови модели (LLMs) и чатботовете демонстрират признаци на когнитивен упадък с времето – подобно на хората.
AI няма да замени лекарите толкова скоро„Тези открития поставят под въпрос предположението, че изкуственият интелект скоро ще замени човешките лекари,“ пишат авторите на изследването. „Когнитивното влошаване, което наблюдаваме при водещите чатботове, може да повлияе на тяхната надеждност при медицинската диагностика и да подкопае доверието на пациентите.“
За да тестват когнитивните способности на публично достъпните чатботове, задвижвани от LLM, учените прилагат Montreal Cognitive Assessment (MoCA) – тест, който невролозите използват за оценка на вниманието, паметта, езиковите способности, пространствените умения и изпълнителните функции на ума. MoCA най-често се използва за ранно откриване на когнитивни нарушения, свързани със заболявания като Алцхаймер и деменция.
В рамките на теста субектите трябва да изпълняват задачи като да нарисуват часовник с определено време, последователно изваждане на 7 от 100, запомняне на възможно най-много думи от зададен списък и други. При хората резултат от 26 от 30 точки се счита за нормален, без признаци на когнитивно увреждане.
Когнитивен спад при по-старите езикови моделиДокато някои аспекти на теста като назоваване, внимание, езикови умения и абстрактно мислене се оказват лесни за повечето LLM модели, всички те показват слаби резултати в задачи, свързани с пространствени и изпълнителни функции. Освен това, някои модели показват значително по-ниски резултати в областта на забавеното припомняне.
От критично значение е фактът, че най-новата версия на ChatGPT (версия 4) постига най-висок резултат – 26 от 30 точки, докато по-старият модел Gemini 1.0 достига едва 16 точки. Това подкрепя идеята, че по-старите езикови модели демонстрират признаци на когнитивен упадък.
Какво означава това за бъдещето на AI в медицината?Авторите на изследването подчертават, че техните заключения са само наблюдателни – критичните разлики между начина, по който работи човешкият мозък и AI, не позволяват директно сравнение. Въпреки това, учените предупреждават, че това може да е „значителна област на слабост“, която може да забави разгръщането на AI в клиничната медицина.
Специалистите също така препоръчват да не се използва AI за задачи, изискващи визуална абстракция и изпълнителна функция, тъй като именно в тези области езиковите модели показват най-слабите си резултати.
Това изследване също повдига любопитната идея за нов пазар за човешките невролози – диагностициране на когнитивните проблеми на самите изкуствени интелекти.
Прочети цялата публикация