2026. július 1., szerda · Kutatás

SkillOpt: a Microsoft Research az ügynök-készségeket tanítható paraméterként kezeli, modellsúlyok módosítása nélkül

A Microsoft Research kutatói bemutatták a SkillOpt keretrendszert, amely az AI-ügynökök utasításkészleteit (skill-jeit) nem kézzel szerkeszti, hanem betanítási folyamatként optimalizálja – anélkül, hogy a nyelvi modell súlyait módosítaná. A megközelítés lényege, hogy a skill-fájlt a befagyasztott modellen kívüli tanítható paraméterként kezeli, lépésméret-kontrollt, validációs kapuzást és elutasított szerkesztésekből nyert visszacsatolást alkalmazva. A szerzők szerint hat benchmarkon, hét célmodellen és három végrehajtási módban összesen mind az 52 kiértékelési cellában a SkillOpt érte el a legjobb vagy azzal egyenértékű eredményt. A kutatók azt is állítják, hogy az optimalizált készségek modellméretek, ügynökkeretrendszerek és rokon feladatok között is átvihetők, ami újrafelhasználható munkafolyamat-tudásra utal.

Miért fontos?

Amennyiben az eredmények megerősödnek, a módszer modellsúly-frissítés nélkül javíthatja az AI-ügynökök megbízhatóságát éles üzemi környezetben.

Források

Microsoft Research Kutatás

Kapcsolódó témák

Napi összefoglalók AI kutatás #Microsoft Research#AI-ügynök optimalizálás

Napi összefoglaló

Ez a hír a 2026. július 1., szerda napi AI összefoglaló része.

Kapcsolódó hírek

Memora: a Microsoft új memóriarendszere akár 98%-kal kevesebb kontextus-tokennel dolgozik AI-ágenseknél

A Microsoft Research bemutatott egy Memora nevű skálázható memóriarendszert, amely az AI-ágensek hosszú távú feladatkezelését célozza. A rendszer a tárolt gazdag memóriatartalmat elválasztja a könnyűsúlyú absztrakciókra és kulcsingerekre épülő keresési mechanizmustól, így az absztrakció és a specifikusság között egyensúlyt teremt. A Microsoft Research szerint a Memora új csúcseredményt ér el a LoCoMo és LongMemEval benchmarkokon, felülmúlva a Mem0-t, a RAG-ot és a teljes kontextusú inferenciát, miközben akár 98%-kal kevesebb kontextus-tokent használ. A tanulmányt az ICML 2026 konferencián publikálják, kódja nyílt forráskódúként elérhető a GitHubon. A fejlesztés a hónapokig tartó projekteken dolgozó AI-asszisztensek számára lehet kulcsfontosságú, ahol az eddigi megoldások vagy túl töredékes, vagy túlságosan elnagyolt módon kezelték a korábbi interakciókat.

Képzés nélküli koncepció-alapú magyarázatok: multimodális nyelvi modellek 62–88%-os pontossággal azonosítanak fogalmakat

Egy nem lektorált kutatás azt vizsgálja, képesek-e közepes méretű multimodális nagy nyelvi modellek (7B–32B paraméter) zero-shot módon – külön betanítás nélkül – szemantikus fogalmakat rendelni képek kijelölt régióihoz objektum- és alkatrész-szinten. A szerzők reprodukálható értékelési protokollt javasolnak (CoNa és Open-CoNa), zárt és nyílt címkekészlettel. Négy modellen végzett kísérleteik szerint 62–88%-os objektumszintű pontos egyezési pontosság érhető el, ami a kutatók szerint a képzés nélküli koncepció-annotálás potenciálját mutatja. A Financial Times emellett arról számol be, hogy az AI kis számítási kapacitással is képes mintázatokat felismerni csillagászati adatokban, ami a költséghatékony megoldások szélesebb alkalmazhatóságát illusztrálja.

Közlekedésmérnöki AI-ügynök fejlesztése: hat nagy nyelvi modellt finomhangoltak szakterületi szabványokra

Egy nem lektorált kutatás szisztematikus módszert javasol közlekedésmérnöki célú, testreszabott generatív AI-ügynök fejlesztésére. A szerzők amerikai közlekedési kézikönyvekből, tervezési irányelvekből és szabályozási dokumentumokból álló szakértői korpuszt állítottak össze, majd hat korszerű nagy nyelvi modellt hangoltak finomra LoRA (Low-Rank Adaptation) keretrendszerrel. A kiértékelés BLEU-4 és ROUGE metrikákkal történt; a kutatók állítása szerint a Qwen2.5-7B és a LLaMA-3.1-8B modell érte el a legmagasabb szakterületi illeszkedést és válaszminőséget. A szerzők azt hangsúlyozzák, hogy a LoRA-alapú adaptáció javítja a műszaki tartalom értelmezését és a kontextusfüggő következtetést. A kutatás reprodukálható fejlesztési keretet kínál szakterületi AI-ügynökök építéséhez, bár a módszer valós mérnöki környezetben történő validálása további lépést igényel.

HemaGuide: MI-ágens javítja a hematológiai daganatok kezelési döntéstámogatását

A Nature Medicine-ben megjelent tanulmány bemutatja a HemaGuide nevű, helyileg telepíthető nagy nyelvi modell alapú ágenst, amely strukturálatlan klinikai dokumentumokból kezelési javaslatokat generál hematológiai rosszindulatú daganatokhoz. A rendszer irányelvekre, molekuláris adatokra és több mint 2000 valós tumorbizottsági esetre támaszkodik. A szerzők szerint 45 komplex eseten végzett vakított értékelésben a HemaGuide jelentősen javította a tumorbizottsági döntésekkel való egyezést. 70 misszensz variáns automatikus osztályozása magas egyezést mutatott szakértői standardokkal, onkogén variánst nem minősített jóindulatúvá. A medián válaszidő 39 másodperc volt, szemben a szokásos órákba telő manuális munkafolyamattal.