Míg azonban a megoldás központúság egyenesen a problémák megoldására törekszik, addig a mesterséges intelligencia sokkal plasztikusabb technológia, és kevésbé közvetlen módszertant érdemel. A dolgok jelenlegi állása szerint a ChatGPT és rokonai a keresés közeli rokonainak tűnhetnek. Ahogy a web a nyomtatás világából nőtt ki, úgy tűnik, hogy a generatív mesterséges intelligencia a keresés világából nőtt ki. A GPT-t kérdésekkel, lekérdezésekkel és kérésekkel ösztönözzük, hasonló módon, mint ahogyan a keresőmotorokat használjuk. De a mesterséges intelligencia több mint keresés. Nem annyira információt keres, mint inkább generál. És ezt beszélgetés útján is képes megtenni, ami azt jelenti, hogy tisztázó kérdésekkel válaszol a felhasználóknak. Nem kell egy csapásra eredményt szolgáltatnia.
Az információs problémákat olyannyira a keresési paradigmára alapozzuk, hogy feltehetjük magunknak a kérdést, vajon tudjuk-e, hogyan tervezzünk generatív mesterséges intelligenciát. A nagy nyelvi modellek azt generálják, amit tudnak. Interaktívak, és a felhasználókkal kérések és beszélgetések segítségével kommunikálnak. Információt állítanak elő, de nem úgy, hogy dokumentumokat keresnek elő a visszakeresés céljából. A kommunikáció az, amit a generatív MI csinál, amit a keresés nem. Ez egy olyan rendszer, mely több beszélgetési forduló során szerez információt. Ez lehetővé teszi a felhasználók számára, hogy saját lekérdezéseiket már a megfogalmazásuk közben felfedezzék. Mivel a nagy nyelvi modellek nem annyira információt tárolnak, mint inkább információt termelnek, úgy gondoljuk, hogy a mesterséges intelligenciával kapcsolatos tapasztalatok tervezésénél hangsúlyozni kell az interaktív, kommunikatív és társalgási jellegüket.
„Kommunikáció az első” tervezés
Az LLM-ek és a generatív mesterséges intelligencia tervezésének megközelítése során a kommunikációt kell előtérbe helyeznünk. Az olyan hagyományos tervezési elveket, mint a relevancia, a pontosság és a könnyű használat, a kommunikáció és az interakció paradigmáján belül kell újra kontextusba helyezni, nem pedig a keresés és az információkeresés paradigmáján belül. Azért tesszük ezt a megkülönböztetést, mert minden interaktív technológia tervezésének a felhasználói viselkedés és a felhasználói élmény paradigmáját kell követnie. Egy keresőmotor lehetővé teszi a lekérdezéseket: ezért a tervezésének a pontos és releváns eredményekre kell optimalizálnia. A nagyméretű nyelvi modellek lehetővé teszik a beszélgetést: ezért beszélgetőpartnerként kell viselkedniük. Ahhoz, hogy tervezési módszereinket a generatív mesterséges intelligencia új képességeihez igazítsuk, jobban meg kell értenünk, hogy a kommunikáció miért egyedi tervezési rendszer.
A beszélgetés megszervezi az információt
A társalgás maga is az emberi kifejezés és kommunikáció rendezése vagy szervezése. Saját normái és „szabályai” vannak, saját módja az emberek közötti kapcsolatok közvetítésének, és természetesen az információközlésnek. Kommunikációnk a megélt tapasztalatokból fakad, és kifejezi egyéniségünket, pszichológiánkat, érvelésünket, valamint a helyzetek és kapcsolatok kezelését. Az LLM-eknek nem lehet lehetséges tapasztalata, hogy beszélgető alany vagy személy nem élnek, és nincs megélt tapasztalatuk. Tehát nem kommunikálnak élő és tapasztaló szubjektumként. De a mesterséges intelligencia sem csak egy írógép. Gyorsan beszélő, érzelmeket kifejező és hamarosan cselekvő (ágens) géppé válik. Az LLM-eket valójában multimodálisan képzik, és az idei frissítések a multimodálisan átvett tanulásból származó eredményeket mutatják be. A generatív mesterséges intelligencia egyre sokoldalúbbá és a maga módján tapasztalattá válik.
(Kiemelt kép: Unsplash+)