2026. július 1., szerda · Kutatás
SkillOpt: a Microsoft Research az ügynök-készségeket tanítható paraméterként kezeli, modellsúlyok módosítása nélkül
A Microsoft Research kutatói bemutatták a SkillOpt keretrendszert, amely az AI-ügynökök utasításkészleteit (skill-jeit) nem kézzel szerkeszti, hanem betanítási folyamatként optimalizálja – anélkül, hogy a nyelvi modell súlyait módosítaná. A megközelítés lényege, hogy a skill-fájlt a befagyasztott modellen kívüli tanítható paraméterként kezeli, lépésméret-kontrollt, validációs kapuzást és elutasított szerkesztésekből nyert visszacsatolást alkalmazva. A szerzők szerint hat benchmarkon, hét célmodellen és három végrehajtási módban összesen mind az 52 kiértékelési cellában a SkillOpt érte el a legjobb vagy azzal egyenértékű eredményt. A kutatók azt is állítják, hogy az optimalizált készségek modellméretek, ügynökkeretrendszerek és rokon feladatok között is átvihetők, ami újrafelhasználható munkafolyamat-tudásra utal.
Miért fontos?
Amennyiben az eredmények megerősödnek, a módszer modellsúly-frissítés nélkül javíthatja az AI-ügynökök megbízhatóságát éles üzemi környezetben.
Források
Kapcsolódó témák
Napi összefoglaló
Ez a hír a 2026. július 1., szerda napi AI összefoglaló része.