A mesterséges intelligencia (MI) az utóbbi időben, különösen 2022-ben és idén hívószóvá vált. A hype oka a gyors fejlődés, a szöveges utasítás alapján használható szöveget, képet, zenét, esetleg videót, 3D-modellt előállító alkalmazások, mint a legismertebbek: a ChatGPT, a Midjourney vagy a Stable Diffusion.
Nagyon pörög az MI, és a gépi tanulás forradalma, a mélytanulás (deep learning) ugyan már bő egy évtizede jelen van, az igazi áttörést, a széles körben történő használatot a generatív mesterséges intelligencia hozta el. Míg öt-hat éve azt mondtuk, hogy a gépi tanulás a jelen MI-je, addig ma már a generatív változatról állítható ugyanez.
A hagyományos MI nem az ősidők, hanem 2000 utáni technológia
A mesterséges intelligencia ma sem csak generatív MI-ből áll, más területei ugyanúgy léteznek, fejlődnek, csak most nincsenek rivaldafényben, nem beléjük ömlenek irdatlan pénzösszegek. Ezzel együtt, ha a diszciplínát két részre kellene jelenleg felosztani, célszerű az inkább öt-tíz évvel korábbi állapotot tükröző klasszikus és a generatív MI megkülönböztetése.
A hagyományos MI-t szűk, gyenge esetleg keskeny MI-nek is szokás nevezni, ami azért nem pontos, mert egyelőre a generatív MI is ebbe a kategóriába tartozik, azaz egy-egy meghatározott területen remekül és egyre remekebbül használható, az emberi intelligenciával azonos szintű általános MI-vé (Artificial General Intelligence, AGI) viszont néhány fanfáros prognózis ellenére sem egyhamar fog válni.
De akkor mi a hagyományos MI?
Ezek a rendszerek egyedi input-sorokkal dolgozva, adatokból tanulnak, és adatalapú döntéseket, előrejelzéseket hoznak. Ha mondjuk, számítógépes dominót játszunk, a rendszer ismeri a szabályokat, előrejelzi lépéseinket, megteszi a sajátjait. Minden a szabályokon alapul, előre meghatározott stratégia alapján működik. A beleprogramozott lehetőségek szerint működik, semmi újat nem tesz hozzájuk. Intelligens döntéseket képes hozni, de nem lépi túl a program határait. Úgy gyakoroltatták, hogy speciális szabályokat kövessen. A hangasszisztensek vagy a klasszikus keresők hasonló elvek szerint működnek. Persze ezek a rendszerek már nem azonosak az „MI-óidők” a működést is nehezítő bonyolult világmodellel rendelkező megoldásaival, inkább átmenetek azok és a generatív MI között, de ma már klasszikusnak számítanak, pedig tíz-tizenöt esztendőnél általában nem régebbiek. A lényeg, hogy kreatív újítással nem rukkolnak elő.
Az új generáció és a jövő
Hozzájuk képest a generatív MI az új generáció. Megadunk neki egy promptot, és új szöveget, képet, zenét varázsol belőle. Ő is intenzíven használ adatbázist, de vagy meglévő anyagok újraalkotásával, vagy összekombinálásukkal teremt új minőséget, azaz a kreativitás harmadik fajtájára, a transzformatív kreativitásra még nem képes. E hiányossága ellenére mindenképpen valami újjal áll elő, ami a hagyományos MI-re nem jellemző.
A gyakorlóadatokból megtanulja felismerni az új adatok létrehozásához szükséges, a gyakorlósort visszatükröző mintázatokat. Nem véletlen, hogy a GPT-4 az emberi szövegektől megkülönböztethetetlen beszámolókat, leírásokat hoz létre, míg a hagyományos MI-ről nem állítható ugyanez.
Mások a képességei, mások az alkalmazásai. Adatelemzés alapján készít előrejelzéseket, a generatív pedig továbblép, mert az eredetihez hasonló, de új adatokat alkot. Nemcsak felismeri a mintázatokat, hanem mintázatokat generál, és nagyon jó munkát végez.
A generatív MI alkalmazásai szerteágazóak, bármilyen kreatív és innovatív területet forradalmasíthat, míg a hagyományos feladatspecifikus alkalmazásokban remekel, például ajánlórendszerek hatékonyságát optimalizálja. Együtt is használható a kettő: a hagyományos a felhasználói viselkedést elemzi, a generatív az elemzésből hoz létre személyre szabott tartalmat. A jövőben több kombinált alkalmazás várható.