Коротко
Автор эксперимента сравнил две локальные модели — 9B и 30B параметров — на одной и той же задаче для агента. Меньшая модель справилась за три шага, тогда как большая потратила 24 шага и всё равно ошиблась. В посте разбирается, почему размер модели далеко не всегда определяет качество работы агента.
Есть устойчивое убеждение: чем больше параметров у модели, тем она умнее и тем лучше справится с задачей. На практике это не всегда так, особенно когда речь идёт не о простом ответе на вопрос, а о работе LLM-агента, который должен планировать шаги, вызывать инструменты и доводить задачу до конца.
Автор поста три месяца работал с локальными агентами и провёл наглядный эксперимент: одну и ту же задачу дали двум моделям — на 9 миллиардов параметров и на 30 миллиардов. Результат оказался неожиданным.
Разница не в «интеллекте» модели как таковом, а в том, как организован процесс её работы в агентном контуре.
Когда речь идёт о local LLM-агенте, итоговое качество зависит не только от количества параметров, но и от целого набора инженерных решений вокруг самой модели:
Большая модель, лишённая такой обвязки, может «застревать» в избыточных рассуждениях, накручивая шаги без реальной пользы. Меньшая же модель, работающая в грамотно настроенном контуре, действует более прямо и предсказуемо — а значит, быстрее приходит к верному ответу.
Главный практический урок в том, что при разработке локальных агентов стоит вкладываться не только в выбор самой крупной доступной модели, но и в архитектуру взаимодействия с ней: систему промптов, логику остановки, инструменты и способ передачи контекста.
Именно эти детали, а не количество параметров, определяют, сколько шагов агенту потребуется на задачу и насколько точным будет итоговый результат.
Источник: Хабр