2026. július 5., vasárnap · Modellek
A Mistral nyílt forráskódú Leanstral 1.5 modellje 100%-ot ért el a miniF2F formális matematikai benchmarkon
A Mistral AI kiadta a Leanstral 1.5-öt, egy Apache 2.0 licencű, nyílt forráskódú modellt, amelyet a Lean 4 programozási nyelvben végzett formális verifikációra terveztek. A Mistral állítása szerint a modell 100%-os eredményt ér el a miniF2F benchmarkon, amely középiskolai szinttől matematikai olimpiai nehézségig terjedő feladatokat tartalmaz, míg a Putnam-versenyek 672 feladatából 587-et old meg. A cég szerint a modell az algebrai FATE-H és FATE-X benchmarkokon is csúcseredményeket produkál, 87, illetve 34 százalékkal. Bár elsősorban matematikai feladatokra képezték ki, a Mistral közlése alapján kódverifikációra is alkalmas: 57 nyílt forráskódú kódtár átvizsgálása során öt korábban ismeretlen hibát talált, köztük egy túlcsordulási hibát a varinteger nevű Rust könyvtárban. A modell a Hugging Face platformon és ingyenes API-n keresztül érhető el.
Miért fontos?
A formális matematikai verifikáció területén nyílt forráskódú modellként kiemelkedő benchmark-eredményeket mutat, és valós kódbázisokban is hibákat talált.
Források
Kapcsolódó témák
Napi összefoglaló
Ez a hír a 2026. július 5., vasárnap napi AI összefoglaló része.