2026. július 3., péntek · Modellek

Ausztrál startup az AI-csoportgondolkodás ellen: a Springboards Flint modellje változatosabb válaszokat ígér

A legtöbb nagy nyelvi modell – köztük a ChatGPT, Claude és Gemini – meglepően kiszámítható válaszokat ad nyitott kérdésekre: ha véletlenszámot kérünk 1 és 10 között, szinte mindig a 7-et kapjuk. A MIT Technology Review beszámolója szerint az ausztrál Springboards startup erre a problémára fejlesztette ki Flint nevű nagy nyelvi modelljét, amelyet kifejezetten arra tanítottak, hogy nyitott végű kérdéseknél – például úticél-ajánlásoknál – szélesebb válaszskálát kínáljon a mainstream modellekénél. A jelenség azért fontos, mert bár a kiszámíthatóság kódolási vagy kutatási feladatoknál elfogadható, az ötletelés és kreatív tervezés területén az AI-csoportgondolkodás komoly korlátot jelent. A Flint pontos teljesítményéről és összehasonlító teszteredményeiről a forrás nem közöl részleteket.

Miért fontos?

A csoportgondolkodás problémája rávilágít a nagy nyelvi modellek kreativitási korlátaira, ami új piaci rést nyithat a diverzebb válaszokat adó LLM-ek számára.

Források

Financial Times Nemzetközi sajtó MIT Technology Review Nemzetközi sajtó

Kapcsolódó témák

Napi összefoglaló

Ez a hír a 2026. július 3., péntek napi AI összefoglaló része.

Kapcsolódó hírek

Az LLM-ek csoportgondolkodásba ragadtak – egy ausztrál startup változatosabb válaszokat ígér

A nagy nyelvi modellek meglepően kiszámítható válaszokat adnak nyitott kérdésekre: ha véletlenszámot kérünk 1 és 10 között, szinte mindig 7-et mondanak, autómárkánál pedig Toyotát vagy Hondát – mutatja be a jelenséget a MIT Technology Review. Az ausztrál Springboards startup Flint nevű modellje kifejezetten arra lett betanítva, hogy változatosabb, kevésbé sztereotip válaszokat generáljon. A cég társalapítója, Pip Bingemann szerint a fősodorbeli modellek pontosan ugyanazokra az eredményekre konvergálnak, ami kutatásnál vagy kódolásnál elfogadható, de ötletgyártásnál és kreatív feladatoknál komoly korlát. A Flint a hagyományos modellekkel ellentétben a hallucinációkat sem ellenségnek tekinti, hanem a változatosság forrásának. A jelenség szélesebb tudományos figyelmet is kap: novemberben kutatók is vizsgálták az LLM-ek válaszainak szűk eloszlását.

A Google bemutatta a Nano Banana 2 Lite képgeneráló modellt: gyors és olcsó, de kompromisszumokkal

A Google DeepMind elérhetővé tette a Gemini 3.1 Flash Lite Image modellt, amelyet Nano Banana 2 Lite néven ismernek: a cég állítása szerint ez a leggyorsabb és legolcsóbb képgeneráló modelljük. Alapértelmezett módban körülbelül 4 másodperc alatt készít képet, míg a standard Nano Banana-nak ehhez mintegy 20 másodpercre van szüksége. Az API-ár átlagosan 0,034 dollár 1000 képenként, a kimeneti tokenár pedig a Nano Banana 2 felének felel meg. Az Ars Technica szerint az Arena.ai felhasználói értékelései közel azonosak a nem-Lite változatéval, ugyanakkor a Google maga is elismeri, hogy a modell gyengébben kezeli a szövegeket – különösen a kis betűméretűeket –, az infografikákon pontatlan adatok jelenhetnek meg, és a személyek megjelenítése kevésbé konzisztens. A modell tehát gyors prototípuskészítésre és ötletelésre alkalmas, de a részletgazdagság terén elmarad a nagyobb változatoktól.

A kínai Zhipu AI azt állítja, hogy nyílt súlyú GLM-5.2 modellje egyes kiberbiztonsági feladatokban felveszi a versenyt a Mythosszal

A kínai Zhipu AI (Z.ai) kiadta nyílt súlyú GLM-5.2 modelljét, amelyről egyes kutatók a The Verge beszámolója szerint azt állítják, hogy bizonyos sebezhetőség-keresési és kiberbiztonsági forgatókönyvekben az Anthropic Mythos modelljéhez hasonló teljesítményt nyújt. A forrás hangsúlyozza, hogy általánosabb feladatokban a GLM továbbra is elmarad az Anthropic és az OpenAI modelljeitől, ugyanakkor a kínai modellek képességbeli lemaradása jelentősen csökkent. Az amerikai kormányzat a fejlett, sebezhetőségeket felismerni képes MI-modelleket nemzetbiztonsági kockázatnak tekinti, és korlátozni igyekszik Kína hozzáférését az ilyen technológiákhoz és a betanításukhoz szükséges hardverekhez. Mivel a GLM nyílt súlyú, bárki letöltheti és futtathatja, ami rugalmasságot ad, de egyben visszaélési kockázatot is jelent, mivel a felügyelet nehezen biztosítható.

Az OpenAI bemutatja a GPT-5.6 Sol modellt

Az OpenAI előzetesen bemutatta a GPT-5.6 Sol nevű következő generációs mesterséges intelligencia modelljét. Az új modell kiemelkedő képességekkel rendelkezik programozás, természettudományok és kiberbiztonság területén. A vállalat hangsúlyozza, hogy a GPT-5.6 Sol a valaha fejlesztett legfejlettebb biztonsági rendszerrel párosul.