Как мащабирането по време на тестване разкрива скритите способности за разсъждение в малките езикови модели

Много малките езикови модели (SLM) могат да надминат водещите големи езикови модели (LLM) в задачите за разсъждение, според ново проучване на Shanghai Artificial Intelligence Lab. Авторите показват, че с правилните инструменти и техники за мащабиране по време на тестването, SLM с 1 милиард параметри може да надмине LLM 405B при сложни математически тестове. Способността да […]

Прочети цялата публикация

Топ новини

Microsoft обяви голям пробив, който прави възможни масовите квантови компютри до години

Новият S* фреймуърк помага на AI-моделите да пишат по-добър и по-надежден код

Най-голямата кражба на криптовалута в историята: Хакер проби Bybit и открадна етериум на стойност 1,4 млрд. долара

Тръмп призова за директни разговори между Зеленски и Путин за край на войната

Как мащабирането по време на тестване разкрива скритите способности за разсъждение в малките езикови модели