2026. július 1., szerda · Kutatás

Memora: a Microsoft új memóriarendszere akár 98%-kal kevesebb kontextus-tokennel dolgozik AI-ágenseknél

A Microsoft Research bemutatott egy Memora nevű skálázható memóriarendszert, amely az AI-ágensek hosszú távú feladatkezelését célozza. A rendszer a tárolt gazdag memóriatartalmat elválasztja a könnyűsúlyú absztrakciókra és kulcsingerekre épülő keresési mechanizmustól, így az absztrakció és a specifikusság között egyensúlyt teremt. A Microsoft Research szerint a Memora új csúcseredményt ér el a LoCoMo és LongMemEval benchmarkokon, felülmúlva a Mem0-t, a RAG-ot és a teljes kontextusú inferenciát, miközben akár 98%-kal kevesebb kontextus-tokent használ. A tanulmányt az ICML 2026 konferencián publikálják, kódja nyílt forráskódúként elérhető a GitHubon. A fejlesztés a hónapokig tartó projekteken dolgozó AI-asszisztensek számára lehet kulcsfontosságú, ahol az eddigi megoldások vagy túl töredékes, vagy túlságosan elnagyolt módon kezelték a korábbi interakciókat.

Miért fontos?

A hatékony hosszú távú memóriakezelés az AI-ágensek gyakorlati alkalmazhatóságának egyik fő szűk keresztmetszete, amelyet a Memora jelentősen csökkenthet.

Források

Microsoft Research Kutatás

Kapcsolódó témák

Napi összefoglalók AI kutatás #Microsoft Research#AI-memória

Napi összefoglaló

Ez a hír a 2026. július 1., szerda napi AI összefoglaló része.

Kapcsolódó hírek

SkillOpt: a Microsoft Research az ügynök-készségeket tanítható paraméterként kezeli, modellsúlyok módosítása nélkül

A Microsoft Research kutatói bemutatták a SkillOpt keretrendszert, amely az AI-ügynökök utasításkészleteit (skill-jeit) nem kézzel szerkeszti, hanem betanítási folyamatként optimalizálja – anélkül, hogy a nyelvi modell súlyait módosítaná. A megközelítés lényege, hogy a skill-fájlt a befagyasztott modellen kívüli tanítható paraméterként kezeli, lépésméret-kontrollt, validációs kapuzást és elutasított szerkesztésekből nyert visszacsatolást alkalmazva. A szerzők szerint hat benchmarkon, hét célmodellen és három végrehajtási módban összesen mind az 52 kiértékelési cellában a SkillOpt érte el a legjobb vagy azzal egyenértékű eredményt. A kutatók azt is állítják, hogy az optimalizált készségek modellméretek, ügynökkeretrendszerek és rokon feladatok között is átvihetők, ami újrafelhasználható munkafolyamat-tudásra utal.

Megerősítéses tanulás az AI-ágensek finomhangolásában: NVIDIA útmutató és új kutatási keretrendszerek

Az NVIDIA technikai blogján részletes útmutatót tett közzé arról, hogyan alkalmazható a megerősítéses tanulás (RL) – különösen a verifikálható jutalmakkal történő RL (RLVR) és a GRPO módszer – vállalati AI-ágensek domain-specifikus finomhangolására. A cég szerint a Nemotron 3 Super modellt 21 verifikáló környezetben, mintegy 1,2 millió rollout segítségével képezték, a NeMo RL ökoszisztéma pedig nyílt modellekhez kínál skálázható RL-eszközöket. Emellett két nem lektorált kutatási munka is megjelent: a HyPOLE keretrendszer formális logikával (HyperLTL) vezérli a többágenses RL-t részleges megfigyelhetőség mellett, míg egy másik tanulmány elektromos járművek flottáinak intelligens töltését vizsgálja független többágenses RL-megközelítésekkel. Mindhárom forrás azt jelzi, hogy az RL túllépett az általános modellképzésen, és egyre inkább gyakorlati, specializált feladatokban alkalmazzák.

Lebegőpontos hibák felismerése: 14 nagy nyelvi modellt teszteltek új benchmarkkal

Egy nem lektorált kutatás 14 nagy nyelvi modellt (LLM) értékelt aszerint, hogy mennyire képesek statikusan felismerni és osztályozni a lebegőpontos hibákat C forráskódban. A szerzők létrehozták az InterFLOPBench benchmarkot, amely 90 C kernelt és 1130 tesztmintát tartalmaz hat hibakategóriában: kioltás, összehasonlítás, nullával osztás, túlcsordulás, alulcsordulás és NaN. Az eredmények szerint a legújabb modellek – köztük a Qwen 3 32b, Gemini 2.5 Flash, Phi 4 Reasoning, DeepSeek R1T2 és a gpt-oss 20b/120b – 0,88 feletti összesített F1-pontszámot értek el. A teljesítmény hibakategóriánként eltérő: a nullával osztás átlagos F1-értéke 0,85 volt, míg az alulcsordulás (0,61) és a kioltás (0,62) esetében a modellek gyengébben teljesítettek, jelezve a finomabb numerikus jelenségek felismerésének nehézségét.

EAGLE: mélytanulási keretrendszer 99%-kal gyorsabb patológiai képelemzésre

A Nature Communications-ben megjelent tanulmány bemutatja az EAGLE nevű mélytanulási keretrendszert, amely a patológusok munkamódszerét utánozva szelektíven elemzi a szövettani metszeti képek informatív régióit a redundáns csempék ezreinek feldolgozása helyett. A szerzők szerint az EAGLE 43 feladaton, kilenc ráktípuson keresztül felülmúlta a jelenlegi aggregációs módszereket, egyes esetekben akár 23%-kal jobb osztályozási teljesítménnyel. A rendszer egyetlen metszetet 2,27 másodperc alatt dolgoz fel, ami a kutatók állítása szerint több mint 99%-os számítási idő csökkenést jelent. Az EAGLE auditálható munkafolyamatot kínál, mivel azonosíthatók a predikciók alapjául szolgáló csempék, csökkentve a nagy teljesítményű infrastruktúra iránti igényt.