Проучване на Microsoft констатира, че изкуственият интелект все още не е много добър в отстраняването на грешки в софтуерния код

Ново проучване на подразделението Microsoft Research разкрива, че въпреки факта, че изкуственият интелект помага на разработчиците да пишат код, дори усъвършенстваните модели OpenAI (o1) и Anthropic (Claude 3.7 Sonnet) се справят с коригирането на грешките в не повече от половината от случаите. Тестовете са базирани на най-добрия бенчмарк SWE-bench, който измерва способността на ИИ системите […]
Прочети цялата публикация