(Kiemelt kép: Unsplash+)
Úton vagyunk. Útközben. A valós időben zajló vonulásunk a sebességgel szembesít: haladásunk éles vágásai mentén arcok és hangok, fények és formák váltakoznak. Mintegy szaggatott, stroboszkopikus megvilágításban látszanak: fény és fényhiány szabályos váltakozásában, a nappalok és éjszakák láncolatában. Egy különös, kétértékű időben, a volt/nincs válaszvonalai között. (Tillmann J. A.: Töredezett teljességben – A nomád élet fragmentalitása)
Az Nvidia vezérigazgatójának, Jensen Huangnak a The New York Times éves DealBook-csúcstalálkozóján nemrégiben tett kijelentései jelentős pillanatot jelentenek a mesterséges intelligencia fejlődésében. Meglátásai nemcsak az Nvidia növekedését tükrözik, hanem az emberi intelligenciához képest gyorsan felzárkózó MI jövőbeli pályájára is fényt derítenek. Az Nvidia, mely a nagy teljesítményű grafikus feldolgozóegységek (GPU-k) szinonimája, az MI forradalmának középpontjába került. A vállalat harmadik negyedévi pénzügyi eredményei (a bevétel megháromszorozódott, a nettó nyereség pedig 9,24 milliárd dollárra ugrott) ezt a növekedést bizonyítják. Ezt a pénzügyi sikert a GPU-k iránti növekvő kereslet támasztja alá, melyek nélkülözhetetlenek az MI-modellek képzéséhez és az intenzív munkaterhelések kezeléséhez a különböző iparágakban, többek között az autóiparban, az építészetben, az elektronikában, a mérnöki tudományokban, a tudományos kutatásban és az OpenAI ChatGPT-je számára.
Az első MI-szuperszámítógép és annak hatása
Az Nvidia történetében kulcsfontosságú pillanat volt „a világ első MI-szuperszámítógépének” átadása az OpenAI számára. Ez az esemény, melyet Elon Musk érdeklődése katalizált, aláhúzza a csúcstechnológiás hardverek és az élvonalbeli MI-kutatás közötti szinergiát. Az ilyen együttműködések nemcsak az MI gyors fejlődését segítik elő, hanem a technológiai innováció révén a különböző ágazatok jövőjét is alakítják. Jensen Huangnak a mesterséges intelligencia jelenlegi helyzetével kapcsolatos észrevételei fontos különbségtételre világítanak rá. Míg a felismerés és az észlelés terén jelentős előrelépéseket tett a mesterséges intelligencia, a többlépcsős gondolkodásban való jártassága még mindig fejlesztés alatt áll. Ez a hiányosság az, ahol a jövőben az MI fölényéért vívott csaták zajlanak majd, mivel az összetett gondolkodás elsajátítása kulcsfontosságú a mesterséges általános intelligencia (AGI) eléréséhez.
A mesterséges intelligencia versenyelőnye a következő öt évben
Huang előrejelzése szerint a következő öt évben a mesterséges intelligencia „meglehetősen versenyképes” lehet már az emberi intelligenciával szemben a feladatok elvégzésében. Ez az előrejelzés nem csak a jelentős mesterséges intelligencia mérföldkövek időbeli ütemezését határozza meg, hanem paradigmaváltást is sugall abban, ahogyan az MI-t mi emberek érzékeljük, és ahogyan azzal kapcsolatba lépünk majd vele a dolgos hétköznapokban is. A Huang által adott interjúban a vállalatirányítás említése alapvető fontosságú szempont ebben a narratívában. Ahogy az MI egyre inkább az életünk szerves részévé válik, az MI-vállalatok felépítésének és irányításának módja messzemenő következményekkel jár majd. Az Nvidia ellenálló képessége, melyet szilárd irányítási struktúrájának tulajdonítanak, mintát kínál a feltörekvő MI-vállalatok számára, hogy eligazodjanak az innováció és a verseny összetett terepén.
A készen kapható MI-eszközök megjelenése
Huang a jövőre nézve a konkrét iparági igényekre szabott, készen kapható MI-eszközök megjelenését jósolja. Ez a fejlődés demokratizálni fogja a mesterséges intelligenciát, és a chip-tervezéstől és a szoftverkészítéstől kezdve a gyógyszerkutatáson át a radiológiáig az ágazatok szélesebb köre számára teszi elérhetővé. Az ilyen eszközök nemcsak a folyamatokat fogják racionalizálni, hanem új utakat is nyitnak az innováció és a hatékonyság előtt. Huang elutasítja a vállalatok rangsorolását az MI-piacon, ami diplomáciai hozzáállást tükröz egy egyre inkább versenyző területen. Ez a megközelítés nemcsak az MI-fejlesztések együttműködési jellegét ismeri el, hanem rávilágít az MI-ökoszisztéma sokszínűségére és összetettségére is. Mivel az MI új korszakának küszöbén állunk, az Nvidia szerepe és Jensen Huang meglátásai ablakot nyit(hat)nak a jövőbe. A következő öt évben a mesterséges intelligencia területén olyan úttörő fejlesztések várhatóak, melyek kihívást jelentenek az intelligenciáról alkotott elképzeléseink számára, és soha nem látott módon alakítják a világot.
Ahogy útjaink átmetszik a tájakat, úgy vonul el szemünk előtt egy-egy pillanat. Ezt nevezhetjük akár az élet áttűnési sebességének, mellyel valaha volt és egykor leendő élettereinkben megyünk. Mérhetetlen sebességgel haladunk. És ugyanilyen mérhetetlen az a sebesség is, amivel a világ lényei és képei átvonulnak a látómezőnkön: hátrahagyott társaink és elhagyott térségeink metszetszerű tömbökben tűnnek tova. (Tillmann J. A.: Töredezett teljességben – A nomád élet fragmentalitása)
A ki nem mondott igazság
A tényleges mesterséges intelligencia mai transzformátor architektúrája nem áll készen egy általános intelligenciára. Miről is beszélünk? A mesterséges intelligencia évtizedek óta izgalmas terület és viták tárgya. Sok szakértő azt jósolja, hogy egy nap elérjük a valódi általános mesterséges intelligenciát (AGI), vagyis egy olyan típusú MI-rendszert, mely képes bármilyen olyan szellemi feladatot elvégezni, amit egy ember is. De vajon tényleg ott tartunk-e már? Ki fogja ezt megfizetni? Mi lesz a célja és a korlátai? A mesterséges intelligencia kutatásában elért minden előrelépés ellenére sokan úgy vélik, hogy még messze vagyunk a cél elérésétől. Érdemes feltárni az AGI-kutatás jelenlegi helyzetét, és megvitatni, hogy mi kellene ahhoz, hogy valóban kiaknázzuk az MI-ban rejlő teljes potenciált. Az egyik legnagyobb tévhit az AGI-vel kapcsolatban az, hogy már itt van. Bár a gépi tanulás és a természetes nyelvfeldolgozás terén lenyűgöző előrelépések történtek, ezek közül a technológiák közül még egyik sem valósította meg a valódi AGI-t. Ehelyett speciális algoritmusokra és technikákra támaszkodnak, melyeket bizonyos problémák megoldására terveztek. A chatrobotok például képesek megérteni és megválaszolni egyszerű kérdéseket, de nem képesek absztrakt gondolkodásra vagy összetett beszélgetésekben való részvételre. Hasonlóképpen, a képfelismerő szoftverek képesek azonosítani a tárgyakat a képeken, de nem tudnak következtetéseket levonni ezekből a megfigyelésekből.
Mi is az a mesterséges intelligencia?
A mesterséges intelligencia az utóbbi időben nagyon népszerűvé vált az olyan közelmúltbeli fejlesztéseknek köszönhetően, mint a ChatGPT és a Stable Diffusion. Az MI azonban már jóval azelőtt létezett, hogy az olyan kifejezések, mint a „mélytanulás” vagy a „gépi tanulás” megjelentek volna. Az 1940-es és ötvenes években született, amikor a számítógépeket először kezdték használni a mesterséges intelligencia kutatására. A „mesterséges intelligencia” kifejezés azonban már a kezdetek óta vitatott: az emberek akkoriban kételkedtek abban, hogy a gépek valóban intelligensek lehetnek. Ez a szkepticizmus még azelőtt felmerült, hogy felismertük volna a modern mesterséges intelligencia képességeit. A modern MI lényegében olyan számítógépes rendszerek létrehozására utal, melyek képesek olyan tevékenységek elvégzésére, melyekhez általában emberi megismerés szükséges. Ezek a feladatok különböző területeket foglalnak magukban, mint például a vizuális érzékelés, a hallásértés, az ítélőképesség, a nyelvi fordítás vagy a nyelvi produkció. Russell és Norvig szerint a mesterséges intelligencia minden intellektuális törekvésen túllép, és ezáltal átfogó tudományággá válik.
Ez a meghatározás rávilágít a mesterséges intelligencia tág hatókörére, mely túlmutat a szűk szakterületeken, és a legkülönbözőbb területeken felmerülő összetett problémák megoldására összpontosít. A mesterséges intelligenciát illetően alapvetően két fő kategóriát különböztetünk meg: a szűk vagy gyenge mesterséges intelligencia és az általános vagy erős mesterséges intelligencia. A szűk mesterséges intelligenciát kifejezetten egy adott környezetben egyetlen feladat megoldására tervezték, míg az általános mesterséges intelligencia bármilyen feladat elvégzésére és az emberekhez hasonlóan bármilyen környezethez való alkalmazkodásra törekszik. Sajnos a jelenlegi mesterséges intelligenciamodellek szilárdan a szűk mesterséges intelligencia területén gyökereznek.
Metszetről metszetre mozdul el belátásunk. A tudományos-technikai töredezettségben nincs is más választásunk. A megismerésvágy mindig résekben és hasítékokban hatol előre: rétegről rétegre feszíti szét a meglevő teljességet, hogy azt majdan elemeiből újra felépítse. A részlegességek vég nélküli sokaságából felépülő teljesség terhei alatt minden összeroppan. Nincs az a természetes vagy mesterséges intelligencia, mely képes lenne hordozni az elemeire bontott teljesség terhét. (A folyvást ezernyi részlettel gazdagodó újkori világkép ezért omlik össze időről időre. Szilánkjai recsegve-ropogva hullanának szét, ha összetartásuk különféle eljárásai ezt nem hátráltatnák.) (Tillmann J. A.: Töredezett teljességben – A nomád élet fragmentalitása)
Mesterséges általános intelligencia
A mesterséges általános intelligencia (AGI) az intelligens ágensek olyan hipotetikus típusára utal, mely képes a feladatok és területek széles skáláján keresztül megérteni, tanulni és alkalmazni a tudást. A szűk vagy specifikus MI rendszerekkel ellentétben, melyeket egyetlen feladat elvégzésére vagy egy adott probléma megoldására terveztek, az AGI célja az emberi intelligencia általános kognitív képességeinek leképezése. Az AGI rendszerek, ha megvalósulnak, képesek lennének tanulni és alkalmazkodni az új helyzetekhez, megérteni a természetes nyelvet, érvelni, tervezni és döntéseket hozni az emberi lényekhez hasonló módon. Az AGI célja, hogy olyan gépeket hozzon létre, melyek képesek minden olyan szellemi feladatot elvégezni, melyre az ember is képes. Fontos megjegyezni, hogy az AGI még mindig nagyrészt elméleti koncepció, és folyamatos kutatások és viták folynak a megvalósíthatóságáról és lehetséges következményeiről.
A generatív előképzett transzformátorok birodalmában
A GPT a Generative Pre-trained Transformers (generatív előképzett transzformátorok) rövidítése. Olyan neurális hálózati modellek családjára utal, melyek a transzformátor-architektúrát használják, és jelentős előrelépéseket tettek a mesterséges intelligencia területén. A GPT modellek legfontosabb jellemzője, hogy nagy mennyiségű címkézetlen adatból képesek tanulni, majd felügyelt képzéssel finomhangolni az eredményeket. Ez a folyamat lehetővé teszi a GPT-modellek számára, hogy megértsék a mondatokat, lebontsák és új mondatokká építsék fel őket. Mindannyian láttuk már a GPT modellek képességeit. Mégpedig azért, mert teszteltük őket kérdés- és válaszrobotok, szövegösszegzés, tartalomgenerálás és keresés esetén. Mindegyikük alapja egy olyan neurális hálózati modellcsalád, amely a transzformátor architektúrát használja a generatív MI-alkalmazások működtetésére. Tehát, ha ez az architektúra valóban a helyén van, akkor a közeljövőben AGI-re törekedhetünk? A válasz a kutatásaink és személyes nézőpontunk szerint: nem! Lássuk, miért.
A transzformátorok csak egy kiindulópontot jelentenek, méghozzá korlátok között. A Google DeepMind kapcsán egy igazán érdekes tanulmányt tettek közzé „Pretraining Data Mixtures Enable Narrow Model Selection Capabilities in Transformer Models” címmel. A kutatók kiemelték az In context Learning (ICL) lenyűgöző képességeit, de azt is megjegyezték, hogy amikor az előképzési adataiktól eltérő feladatokkal vagy funkciókkal találkoznak, a transzformátor modellek különböző hibamódokat és az általánosítás romlását mutatják még az egyszerű extrapolációs feladatok esetében is. Ez alapvetően azt jelenti magyarul, hogy ha azt akarjuk, hogy egy transzformátor modell csináljon valamit, akkor az adott feladathoz kapcsolódó adatokon kell betanítani. Még ha a feladat egyszerű is, ha a modellt nem képezték ki megfelelően a vonatkozó adatokkal, előfordulhat, hogy nem lesz képes a kívánt funkciót ellátni.
A hiányosság valójában magában a Transzformátorok neurális hálózatban rejlik. Steven Byrnes fizikus szerint, aki a mesterséges általános intelligencia biztonsági kutatásával (más néven „AI Alignment”) foglalkozik, főként az idegtudományokról és algoritmusokról való gondolkodáson keresztül, legalább három fő hiányosság van a Transzformátorok mint AGI architektúrájában: a neurális hálózat, a súlyok és a jutalmak betanításának módja miatt ez megnehezíti vagy lehetetlenné teszi, hogy egy Transzformátor megtanuljon vagy létrehozzon olyan fogalmakat, melyeket az emberek még nem használnak. A Transzformátor rétegek véges száma plafont szab a generatív-modellkeresési folyamat minőségének, a mérlegelésre fordított időnek: az emberek egy kicsit hosszabb és keményebb gondolkodással ki tudják nyújtani a képességeiket. A modell futtatásakor a Neurális Hálózat csak a következtetéshez szükséges számítási időre aktiválódik, és ennyi! A Transzformátor egyfajta információfeldolgozás, mely egy másfajta információfeldolgozást imitál: így várhatóan lesznek olyan esetek, amikor az imitáció megszakad, ami furcsa induktív torzításokhoz, őrült, eloszláson kívüli viselkedéshez vezet. Amit mi személy szerint megértettük, ez főleg azért van, mert az oldalirányú gondolkodást és a dobozon kívüli gondolkodást akarjuk egyszerre utánozni. De képzeljük el, hogy megvan a megfelelő architektúra?
Azok a legendás események, melyek nemrég az OpenAI ügyvezetőjét és igazgatótanácsát érintették, egy aggasztó igazságot tártak fel a mesterséges intelligenciával kapcsolatban. Az OpenAI azon erőfeszítései ellenére (hogy megvédje a mesterséges intelligencia kutatását a pénzügyi érdekektől, úgy tűnik, hogy még a nonprofit struktúra ellenére is), a nyereségvágyból létrehozott mesterséges intelligencia mindig ki lesz téve ezeknek az érdekeknek. Ez egy sajnálatos, de fontos tanulság. Miközben elvárjuk, reméljük és dolgozunk egy hasznos mesterséges általános intelligencia kifejlesztéséért, a valóság az, hogy a vállalatok vagy szervezetek által kifejlesztett MI-rendszerek végső soron elsősorban a pénzügyi céljaikat fogják szolgálni (ez azt jelenti, hogy még ha az OpenAI igazgatótanácsa a mindenki számára biztonságos AGI küldetésének védelmére is törekedett, a befektetők és az alkalmazottak mégis nyomást gyakoroltak rá, hogy a profitot a biztonság elé helyezzék). Őszintén hála Istennek (tényleg azt kell mondanunk), még nincs ilyen architektúránk: az alapjait már megvan, így ez tényleg csak idő kérdése lesz.
Milyen ötletelési képességeket fogunk adni ennek az AGI-nak? Milyen megkötések, súlyok, előítéletek és így tovább? Hogyan lesz ez az általános intelligencia mentes a „Teremtője” érdekeitől, és egyébként ez az a fajta mesterséges intelligencia, amiről álmodunk? Az OpenAI-nál kialakult helyzet rávilágít arra, hogy nagyobb átláthatóságra van szükség a mesterséges intelligencia fejlesztése körül. Tudatában kell lennünk annak, hogy a vállalatok által létrehozott mesterséges intelligencia elkerülhetetlenül az ő érdekeiket fogja szolgálni, hacsak nem kerül sor erős felügyeletre. Ez magában foglalja a szabályozást és a nyilvános ellenőrzést annak biztosítása érdekében, hogy a mesterséges intelligencia rendszereket felelősségteljesen, a biztonságot elsődleges prioritásként kezelve fejlesszék. Bár az OpenAI eseményei csalódást okoztak, fontos tanulsággal szolgálnak arról, hogy milyen kockázatokat rejt, ha a mesterséges intelligencia fejlesztését pénzügyi ösztönzők irányítják. Amit igazán szeretnénk látni, az az, hogy egy kicsit több etikai és filozófiai hangsúlyt fektessünk erre a kurrens témára.
Annyi máshoz hasonlóan a teljességre törekvés is egyre inkább technikai jellegű. A technikai eszközrendszer teszi lehetővé távoli tájak és történések közvetítését, láthatóvá a tér kiterjedésének nagyságrendjét: a térbeli teljesség felmérését. A technológiai egyneműségnek az egész Földre kivetülő hálója fokozatosan felszámol minden lényeges különbözőséget. A technikai tökéletességeszmény uralmát terjeszti, s ez nemcsak a távoli múltban kikristályosodott formákat, képzeteket és eszményeket kezdi ki, hanem a modernnek mondott képződmények iránt is kíméletlen kételyt ébreszt. Ezért a lezártság, a befejezettség jegyében álló alkotásokra is az alapos gyanú árnyéka vetül. (Tillmann J. A.: Töredezett teljességben – A nomád élet fragmentalitása)
Az egyszerű ok, amiért az AGI nem érhető el
Olyan korban élünk, amikor a határ a sci-fi és a valóság között gyorsabban elmosódik, mint valaha. Mindenhol a mesterséges általános intelligenciáról (Artificial General Intelligence, AGI) beszélnek, a mesterséges intelligencia egy olyan formájáról, mely képes megérteni, tanulni és alkalmazni a tudást a feladatok széles skáláján, hasonlóan az emberhez. Ez egy forró téma, egy menő beszélgetés tárgya és egy kínzó technológiai álom. De itt jön a csavar: ez nem fog megtörténni. Az ok egyszerű, mégis mélyreható. Először is, tisztázzunk valamit: nem vagyunk cinikusok. Sem azok, akik csak úgy mondogatják, hogy „Ez lehetetlen!”. De amikor az AGI-ről van szó, van egy alapvető probléma, amit a legtöbb „technológiai evangélista” kényelmesen figyelmen kívül hagy. Magának az emberi intelligenciának a megértéséről van szó. Gondoljunk csak bele. Mi, mint faj, még mindig küzdünk saját elménk összetettségével. Az idegtudomány, a pszichológia, a filozófia mindannyian évszázadok óta kutatják az emberi tudatosság rejtélyét, de még sehol sem tartunk a teljes megértéséig. Hogyan várhatjuk el tehát, hogy létrehozzunk egy olyan általános intelligenciaformát, mely a sajátunkat utánozza?
Az AGI szószólói gyakran beszélnek a technológia exponenciális növekedéséről, Moore törvényéről és minden ilyesmiről. Persze, ugrásszerűen fejlődött a számítási teljesítmény és a gépi tanulás. De az AGI nem csak egy jobb algoritmus vagy egy erősebb processzor. Hanem az emberi gondolkodás és érvelés árnyalt, gyakran irracionális és mélyen összetett természetének leképezése lenne. És ez az a pont, ahol a túlbuzgó optimizmus kudarcot vall. Merüljünk mélyebbre. Az emberi intelligencia nem csak az információfeldolgozásról szól. Hanem az érzelmekről, az intuícióról, az erkölcsről, a kreativitásról és számtalan más olyan megfoghatatlan dologról, melyet a gépek egyelőre még csak fel sem tudnak fogni. Az empátiát nem lehet kódolni. Nem lehet számszerűsíteni egy vers lélekemelő mélységét. Hogyan programozhatunk be egy gépet arra, hogy megértse egy bonyolult helyzet árnyalt etikáját, vagy hogy értékelje egy naplemente szépségét?
De várjunk csak, van még más is. Van egy eredendő arrogancia abban a feltételezésben, hogy képesek vagyunk létrehozni egy AGI-t. Ez olyan, mintha azt mondanánk, hogy „Istent játszhatunk”. De vajon képesek vagyunk-e rá? A természet részei vagyunk, nem felette létező entitások. Az emberi intelligencia teljes spektrumának megismétlésére tett kísérleteink talán csak önhitt túlzásnak tűnnek. Ne értsenek félre. A szűk értelemben vett mesterséges intelligencia fejlődése csodaszámba megy. Forradalmasítottak iparágakat, megoldottak összetett problémákat, és számtalan módon megkönnyítették az életünket. De ez nem AGI. Ez egy speciális, avagy „alternatív intelligencia” (helyesebb lenne az MI helyett ezt használni), melyet speciális feladatokra szabtak. Az AGI ezzel szemben egy teljesen másfajta játék, melyhez nem csak technikai képességekre van szükség, hanem az emberi tapasztalatok mély, belső megértésére is. Összefoglalva, míg a technológia továbbra is el fog kápráztatni minket, az AGI egy vágyálom marad. Az emberi intelligencia összetettségét, annak minden érzelmi, etikai és intuitív rétegével együtt, nem tudjuk megismételni. Talán ez jó dolog. Talán a titokzatosságban rejlik a szépsége, abban a tényben, hogy néhány dolog egyedülállóan emberi marad. Végül is, egy olyan világban, melyet egyre inkább algoritmusok és adatok irányítanak, nem megnyugtató tudni, hogy létezésünk bizonyos aspektusai a gépek hatókörén kívül esnek?
A töredék horizontja szaggatott szemhatár. Egy-egy látvány részletei a belátás különböző pillanataiban derengenek fel. Az ilyen, időbeli szakadások a térbeli különneműségeket teszik nyilvánvalóvá. Az egyneműsítés mindenkor önkényes aktusa helyett a töredékek közt meghagyott hasadékok más terek és vonatkozások lehetőségére figyelmeztetnek. A töredékek horizontjának nézője a szaggatott szemhatáron nem csak a megalkotott képeket látja. A közbenső résekben e szemhatár a szemlélő legsajátabb képeivel egészül ki. (Tillmann J. A.: Töredezett teljességben – A nomád élet fragmentalitása)