Tudomány
Az AI még „nem igazán okos” – merre tart a mesterséges intelligencia következő korszaka?
„Nincsenek olyan robotjaink, amelyek akár csak egy patkány szintjén is képesek lennének megérteni a fizikai világot” – mondja Yann LeCun, a mesterséges intelligencia egyik legismertebb kutatója.
LeCun egy évtizeden át dolgozott a Meta (a Facebook anyavállalata) vezető AI-kutatójaként, majd 2025-ben távozott a vállalattól, és megalapította az Advanced Machine Intelligence Labs (AMI Labs) nevű céget. Célja, hogy a mesterséges intelligenciát a jelenlegi rendszereken – például a ChatGPT-n, a Claude-on és a Gemini-n – túlmutató szintre emelje. Véleménye szerint ezek az eszközök sok feladatra kiválóak, de soha nem lesznek képesek valódi, összetett fizikai helyzetek kezelésére, például arra, hogy egy robot biztonságosan elvégezze a házimunkát.
„Ezek a rendszerek nem vezetnek el az emberi vagy akár az állati szintű intelligenciához, mert nem képesek a valós világból származó adatok kezelésére. Egyszerűen nem erre épültek.” LeCun ezt a párizsi VivaTech technológiai konferencia margóján nyilatkozta.
Egy új irány a mesterséges intelligenciában
Az AMI Labs ezért egy teljesen új AI-architektúrán dolgozik, amely nem a ChatGPT-hez és hasonló nagy nyelvi modellekhez (LLM-ekhez) használt technológiára épül.
A befektetők komoly potenciált látnak a projektben. A vállalat az év elején több mint 1 milliárd dolláros magvető finanszírozási kört zárt le. A befektetők között szerepel az Nvidia, valamint Jeff Bezos magánvagyonát kezelő befektetési alap is. Ez Európa egyik legnagyobb induló tőkebevonási köre volt.
Miért nem elég okosak a mai AI-modellek?
LeCun szerint a nagy nyelvi modellek kiválóan teljesítenek programozásban, matematikai feladatok megoldásában és szövegalkotásban. Szerinte azonban ezek jól meghatározott, kiszámítható problémák. „Az LLM-ek lényegében tudást halmoznak fel. Képesek visszaadni azt, amire betanították őket, de ettől még nem lesznek igazán intelligensek. Hiányzik mögülük a valódi megértés.” A valós világban szinte minden cselekvésnek rengeteg lehetséges következménye lehet, ami sokkal rugalmasabb gondolkodást igényel.
LeCun egy egyszerű példát hoz: egy tollat az élére állít. Mi történik, amikor elengedi? Egy kisgyermek is tudja, hogy a toll eldől. Azt azonban senki sem próbálja megjósolni, pontosan melyik irányba esik, mert ezt előre nem lehet meghatározni. Egy nagy nyelvi modell viszont statisztikai minták alapján megpróbálhat egyetlen konkrét előrejelzést készíteni. Ez az előrejelzés szinte biztosan hibás lenne, mert a rendszer nem a fizikai valóságot érti meg, hanem csupán statisztikailag valószínű válaszokat generál.
A JEPA: a világ működésének modellezése
LeCun szerint az AMI Labs által fejlesztett Joint Embedding Predictive Architecture (JEPA) éppen az ilyen problémák megoldására készült. A rendszer a valós világról készít absztrakt modelleket, amelyek segítségével képes felmérni egy adott cselekvés lehetséges következményeit.
Az ilyen absztrakciók létrehozása rendkívül összetett matematikai folyamat, de lényegében kiszűrik a lényegtelen információkat, és csak a döntésekhez szükséges tudást hagyják meg. A toll példájánál maradva: a rendszer felismeri, hogy teljesen felesleges megjósolni a dőlés pontos irányát, mert ez nem hordoz hasznos információt.
A robotika következő nagy kihívása
A rugalmasabb mesterséges intelligencia fejlesztése a robotikai ipar egyik legfontosabb célkitűzése. Világszerte milliárdokat fektetnek humanoid robotok fejlesztésébe, amelyek képességei évről évre látványosan javulnak. Ennek ellenére továbbra is rendkívül nehéz és költséges megtanítani őket olyan hétköznapi feladatokra, mint a vasalás vagy a mosogatógép bepakolása.
LeCun szerint ebben a környezetben a jelenlegi nagy nyelvi modellek zsákutcát jelentenek. „Az LLM-ek a robotika szempontjából nagyrészt reménytelenek.” Azt is hozzáteszi: „Az az elképzelés, hogy pusztán a nyelvi modellek méretének növelésével eljutunk a szuperintelligenciához, egyszerűen nem fog megvalósulni.”
Egyre többen keresnek alternatívát
LeCun véleményét az AI-iparág számos vezető kutatója osztja. Közéjük tartozik Ingmar Posner, az Oxfordi Egyetem alkalmazott mesterséges intelligencia professzora és az Applied AI Lab vezetője, aki egyben Amazon Scholar is. Szerinte a következő évtized a magyarázni képes AI-rendszerekről fog szólni. „Olyan modellekre van szükségünk, amelyek képesek megválaszolni olyan kérdéseket, mint: Mi számít igazán? Mi okoz mit? Mi történne, ha másképp cselekednék?” Posner kutatócsoportja négy éve dolgozik egy alternatív AI-megközelítésen, amely az úgynevezett World Models (világmodellek) kategóriájába tartozik.
Világmodellek: amikor az AI elképzeli a jövőt
A világmodellek koncepciója ugyan évtizedek óta ismert, de a terület egyik fontos mérföldkövének a David Ha és Jürgen Schmidhuber által 2018-ban publikált tanulmány számít. Felismerésük szerint a gépi tanulás és a számítási kapacitás fejlődésének köszönhetően egy mesterséges intelligencia képes lehet pusztán egy belső, mentális világmodell segítségével megtanulni különböző feladatokat. Azóta a világmodellek kutatása jelentősen felgyorsult.
A Google Dreamer nevű rendszere például úgy tanulta meg gyémántokat gyűjteni a Minecraft videojátékban, hogy különböző jövőbeli forgatókönyveket szimulált, mielőtt döntést hozott. Posner szerint az általuk fejlesztett úgynevezett „mechanisztikus világmodell” újabb lépést jelenthet ezen az úton. „Olyan rendszerekre van szükség, amelyek képesek a tudást strukturált módon tárolni, majd szükség esetén előhívni, kombinálni és módosítani.” Arra azonban szerinte senki sem tud pontos választ adni, mikor készülnek el ezek az új modellek.
„Ha 2017-ben vagy 2018-ban megkérdeztek volna bárkit, mikor lesz valami a ChatGPT-hez hasonló, valószínűleg mindenki azt mondta volna: még évtizedek.” A ChatGPT első verziója végül 2022 novemberében jelent meg.
A világmodellek fejlesztésén jelenleg több nagy szereplő is dolgozik. A Google DeepMind a Genie modellen, a londoni Wayve a Gaia rendszeren, míg Fei-Fei Li 2023-ban alapította meg San Franciscóban a World Labs vállalatot.
Mi következik?
LeCun szerint az AMI Labs az év hátralévő részében tovább finomítja AI-rendszerét, amelyet várhatóan jövőre először ipari környezetben kezdenek alkalmazni. Ha ez sikeres lesz, a következő cél már egy általános célú intelligens rendszer lehet. „Hosszabb távon olyan általános intelligenciájú rendszereket szeretnénk létrehozni, amelyek minimális betanítással szinte bármilyen feladatra alkalmazhatók.”
Lesz még szerepe az embernek?
Felmerül a kérdés: mi történik az emberekkel egy olyan világban, ahol a robotok önállóan képesek dolgozni? LeCun szerint az ember szerepe nem tűnik el. „Mindig szükség lesz emberekre, akik eldöntik, milyen kérdéseket érdemes feltenni, mit kell megépíteni, mit kell létrehozni. Ez az, ami igazán emberi.” Úgy véli, a jövő mesterséges intelligenciája nem leváltja, hanem támogatja az embert.
„A jövő AI-rendszereivel való kapcsolatunk olyan lesz, mint egy vállalatvezetőé vagy politikai vezetőé a tanácsadóival. Sok közülük okosabb lehet nála, de továbbra is az ember határozza meg a célokat és hozza meg a végső döntéseket.”
Forrás: BBC