2026. június 29., hétfő · Kutatás
A Sina háromparaméteres VibeThinker-3B modellje a százszor nagyobb modellek szintjén teljesít matekban és kódolásban
A kínai Sina (Weibo anyavállalata) kiadta VibeThinker-3B modelljét, amely mindössze 3 milliárd paraméterrel egyes matematikai és kódolási benchmarkokon – a cég technikai jelentése szerint – a 200-333-szor nagyobb modellekkel, például a DeepSeek V3.2-vel és a Kimi K2.5-tel vetekszik. A modell az Alibaba Qwen2.5-Coder-3B alapmodelljére épül, a teljesítményt többlépcsős utóképzéssel érik el. A LeetCode-versenyeken (2026 április–május) 128-ból 123 feladatot elsőre megoldott, megelőzve a GPT-5.2-t és a Claude Opus 4.6-ot – állítja a Sina. Ugyanakkor a széles tárgyi tudást igénylő GPQA-Diamond benchmarkon a modell jelentősen elmarad nagyobb riválisaitól. A kutatók következtetése szerint a strukturált logikai gondolkodás jól tömöríthető kis modellekbe, de a faktikus világtudás továbbra is nagy paraméterszámot igényel.
Miért fontos?
A kutatás arra utal, hogy a logikai képességek kis modellekben is elérik a csúcsszintet, míg a tényszerű tudáshoz továbbra is nagy modellek kellenek.
Források
Kapcsolódó témák
Napi összefoglaló
Ez a hír a 2026. június 29., hétfő napi AI összefoglaló része.