(Kiemelt kép: Unsplash)
A prompt-gazdasággal együtt új karrierlehetőségek jönnek, ilyenek például a prompt mérnökök, akik a mesterséges intelligencia által működtetett kategóriákat gondozzák és menedzselik az olyan piactereken, mint a Fiverr, valamint ide tartoznak a promptokat, promptolási tippeket, workshopokat és rendezvényeket létrehozó és értékesítő egyéb vállalkozók is. Emellett egész szektorok, így a tartalomkészítők is igyekeznek megtanulni, hogyan kell írásos és vizuális generatív mesterséges intelligenciát generálni. Ez a friss „mozgalom” felveti a kérdést, hogy az új prompting készségkészlet a fejlett technológia mellékterméke, vagy a mai és még primitív generatív MI-felhasználói felületek eredménye, melyeket a közönség még nehezen tud csak használni a dolgos hétköznapokban? Bár egyesek komoly pénzeket keresnek ma már a promptolással (az egyik vállalat 250.000 dollárt fizetett egy mesterséges intelligencia promptoló mérnöknek nemrég), úgy vélhetjük joggal, hogy a prompt-központú vállalkozások rövid életű fellendülésre számítanak csak. Ha figyelembe vesszük a promptolás megtanulásának szükségességét, akkor joggal feltételezhetjük, hogy a generatív MI technológiai vállalatok jelentős fejlesztéseket fognak kínálni felületeikhez hamarosan.
Miért is? A technológiai eszközök korábbi változatainál a prompting vagy az alapvető bevitel a korai generációikban még mindennapos rutinfeladat volt. Ahogy fejlődtek, az interfészek intuitívvá váltak, és szélesebb közönség körében történt meg az elfogadásuk. Íme néhány párhuzam a régebbi, tartalom gyártáshoz használt eszközökkel: a Jumpstation korai változata a modern Google-keresések egyszerűségével szemben. A Photoshop puritán alkalmazása a 90-es években a fényképek szerkesztésére, szemben az Adobe Lightroom mai változatával. Kézi HTML-kódolás a mai, kód nélküli plug and play honlapkészítőkkel szemben. Az MS-DOS szöveges promptok kontra Windows 11 grafikus felülete. Mit jelent mindez a mindennapi munkavállalók számára, akiknek most már a mesterséges intelligencia eszközeivel kell(ene) együttműködniük? Meg kell tanulniuk a promptolást, legalábbis egyelőre, akár akarják, akár nem. Bizonyos munkakörökben ugyanis előbb vagy utóbb a túlélés záloga lehet.
A promptolás már a kötelező rossz
A ChatGPT-nek a Bingbe való, kissé kevésbé lelkes integrációja körüli izgalom nagy része a keresések megkönnyítéséről szólt csupán. Ezek az egyszerűbb és „könnyebb” válaszok megfelelnek ma a vállalkozások és a magánszemélyek azon igényének, hogy kérdéseikre emészthető, olvasható formában adják meg a válaszokat. Ez a jobb eredmények iránti igény az oka annak, hogy a Google elsiette és elszúrta a Bard, a saját mesterséges intelligenciás digitális „cselédje” bevezetését. Ne feledjük, a nagyvállalati generatív szövegkísérletek még mindig nagyon koraiak. Arra számíthatunk, hogy a Bing GPT eszköze jobban fog fejlődni, amint a kezdeti kihívások közül néhányat sikerült majd kiküszöbölniük. Amíg ezek a fejlesztések nem tartalmaznak intuitívabb felhasználói felületeket, addig az emberek nem fognak értelmesebb eredményeket sem kapni a generatív MI-eszközökből. A szöveges tartalomgyártók elsiették a generatív MI-eszközök bevezetését, hogy mindennapos használatba kerüljenek és ténylegesen használható tartalmakat hozzanak létre a mai üzleti igényeiknek megfelelően. Bár ezek az eredmények a tartalom témájától és típusától (és a ChatGPT forrásadataitól) függően nagymértékben eltérnek, a tartalomkészítők (írók, copywriterek és társaik) bizonyos korlátokkal szembesülnek még nap, mint nap.
Ahhoz, hogy értelmes kimeneteket kapjanak ezekből az eszközökből, nekik is meg kell tanulniuk, hogyan kell az MI-t megfelelően „ösztökélni”. A grafikusok hasonló technológiai elfogadási görbével néznek szembe, de az MI képgenerátorok ma már sokkal jobban elterjedtek és be is fogadta egy bizonyos közösségük is már őket. Az illusztrációs eszközökkel ellentétben a generatív képi mesterséges intelligenciák nem rendelkeznek ma ikonalapú eszközökkel, ehelyett a legtöbbjük a Discord interfészeken keresztül történő szöveges bevitelre támaszkodik csupán még. Amilyen primitívek ma még ezek a beviteli interfészek, valószínűleg ezek a fapados bemenetek is fejlődni fognak a felhasználók igényessége miatt előbb vagy utóbb (lásd az A1111 és InvokeAI kísérletei a Stable Diffusion kapcsán). Ennél talán még izgalmasabbak az olyan cégek felhasználási eset-specifikus megvalósításai, mint a Coca-Cola, a Fiat, a HubSpot, a Kia és a Salesforce. Ezek a GPT-implementációk meghatározott vállalat- vagy funkcióspecifikus adatokon lesznek már betanítva, és remélhetőleg konzisztensebbek lesznek a kimeneteik is. A 2024-ben érkező Fiat Metaverzum esetében a megvalósítás már a Microsoft Teams felületét fogja használni eleve, hogy megkönnyítse az autóvásárlók integrációját. Remélhetőleg ez az egyedi megközelítés a témában gazdagabb és a gyakorlatban is működve leküzdi a fő ChatGPT platformokon tapasztalt jelenlegi prompting és kimeneti kihívások egy jó részét.
A generatív MI legnagyobb problémája
Jelentős kihívást jelent az, hogy a hétköznapi felhasználók ma nem képesek a generatív mesterséges intelligenciát még könnyen a kívánt eredmények eléréséhez megfelelően irányítani. A technológia piaci bevezetése így lassabb és hiányosabb is lesz, amíg az MI bemenetei nem javulnak jelentősen. Ezek az input felületek alapvetően olyan adatpontok, melyek segíthetnek az MI-nek jobb eredményeket is produkálni. Bármennyire is szeretik a Discordot használni a Midjourney kérések teljesítésére, egy idő után nagyon frusztráló tud lenni ez a felhasználói felület sokak számára. Amikor képeket akarunk fejleszteni, egyszerűen nem tudjuk manuálisan megváltoztatni még a képet a szokásos illusztrációs ikonos eszközökkel. Nem tudjuk hatékonyan betanítani a mesterséges intelligenciát a kép megváltoztatására vonatkozó konkrét utasításokkal sem. Gyakran marad így egy-egy kép befejezetlen és használhatatlan. Egy „hobbi felhasználó” számára ez még rendben is volna, de a professzionális iparágakban már biztos eredményeket szeretnének gyártani velük, nem fogják így „honosítani” és implementálni ott őket még sokáig. Ne feledjük, hogy a Midjourney-t az egyik legjobb művészeti generátornak tartják, mely ma az interneten elérhető. És mégis, a képek javításához még mindig meg kell küzdeni az MI-vel, majd egy harmadik féltől származó grafikus programon és használható felületen keresztül kell javítani a képeket, hogy elérjük a kívánt végleges üzleti világban is kamatoztatható változatát.
A szövegíróknak szánt szöveggenerátorok áttekintése során hasonló összefüggéstelenségeket találunk a sok különböző mező és a megadható szöveg között. Míg egyes problémák a képzési adatokkal kapcsolatosak, a finomra hangolásra alkalmas felületek is sokkal korlátozottabbak. Ahelyett, hogy egyszerűen utasíthatnánk a mesterséges intelligenciát, hogy javítson X-et vagy vonjon le Y-t, azon kapjuk magunkat hogy inkább új utasításokat adunk meg, és küzdünk azzal, hogy a gondolatainkat valahogy, de írásba ültessük. Ezért kereshetnek ma pénzt a „prompt mérnökök”, néhányan a Prompt Base oldalon már el is adják a promptokat sikeresen tömegeknek. Ha belegondolunk, akkor ez már igazi kapitalizmus a maga nemében, az egyének jutalmazása a kreativitás gépi elsajátításáért cserébe. Ők tőkét kovácsolnak a pocsék, mai primitív felhasználói felületekből. Üdvözöljük az Szép új Prompt-Gazdaságban! Mennyi küzdelmet ér meg ma egy viszonylagos nyereség a generatív mesterséges intelligenciás eszközzel? Míg egyesek fizetni fognak a promptolásért vagy megtanulják, hogyan kell bánni a generatív MI-eszközökkel, mások egyszerűen kihagyják majd ezt a fázist egyszerűen, és fizetnek valakinek azért, hogy elvégezze ezt a „piszkos” munkát helyettük. Mindazonáltal a generatív MI-vel „küzdő” marketingesek és kreatív alkotók számára ennek a problémának ma még húsba vágó és valós, akár karrierükre is kiható hatása van.
El kell fogadjuk a Prompt-Gazdaságot
Mit jelent a prompt-gazdaság egy mesterséges intelligencia által inspirált kreatív elme számára? Botorság arra várni, hogy az MI-fejlesztők frissítsék majd modelljeiket a széles körű elfogadáshoz szükséges és megfelelően kidolgozott okos interfészekkel, pedig ez a technológia elterjedéséhez mindenképpen szükséges lenne. A promptolás az új valóság azok számára, akiknek meg kell tanulniuk, hogyan kell használniuk a generatív MI-t. Ahogyan a keresőmotorok használatának elsajátítása is fontos volt egykor és még mindig fontos ma is, úgy az alkotók számára mostantól a prompting is szükséges alapkészség lesz. Lehet, hogy ez egy viszonylag rövid életű átmeneti időszak lesz, de lehet, hogy nem. A marketingesek és a tartalom előállításáért közvetlenül felelős cégek korifeusainak a számára azonban megkerülhetetlen. Ahogyan arról már szó esett, az iparágban sokan már most is küzdenek az MI elfogadásának kényszerével. Azok, akiknek sikerül, előnyben lesznek, amikor új lehetőségek, előléptetések és munkahelyek elnyeréséről lesz majd szó. Azok, akik nem tudnak alkalmazkodni, lecsúsznak a versenyképes munkateljesítmény skáláján. Végső soron ez jelentheti a különbséget aközött, hogy valaki továbbra is foglalkoztatható marad a piacon, vagy pedig át kell képeznie magát egy új szakmára hamarosan. A prompt gazdaságból való pénzkeresés így folytatódni fog, várhatóan egyre több vállalkozás fogja felkarolni a generatív MI-t és alapértelmezés szerint a promptingot. Néhányan saját interfészeket fejleszthetnek ki a generátorokba mint a Kia. Elképzelhető, hogy a Canva is hamarosan átveszi ezt az eszközkészletet: természetes lépésnek tűnik számukra, hogy a marketingeseknek is adjanak feladatot, hogy mesterséges intelligenciával felturbózott írásos és vizuális tartalmakat hozzanak létre az eddigi sablonjaikhoz. Ezeknek a „promptoló pénzcsinálóknak” a veszélye ma a hosszú élettartam. Mikor fognak a generatív MI-felületek annyira fejlődni, hogy újszerű képességeik és mai még létező előnyük értelmetlenné válnak? Ez a kérdés az, ami elvezet minket a „prompt boom” lehetséges végéhez.
Egy startup vagy egy nagy technológiai szereplő lesz a végzet angyala?
Kissé ironikus, hogy a „Low Code” és „No Code” forradalom idején hirtelen egy szövegalapú Prompt Gazdasággal van most éppen dolgunk. Aki nem ismeri, a Low Code/No Code lehetővé teszi a szoftverfejlesztők, sőt a hétköznapi felhasználók számára is, hogy tényleges kódírás nélkül készítsenek alkalmazásokat. Ez egy természetes evolúció, mely az internetes technológiában többször is már bekövetkezett: lásd a kézi súgók felváltása a kattintható felületekkel. Ebben az összefüggésben elképzelhető, hogy egy olyan nagy technológiai vállalat, mint a Google, a Microsoft vagy a Salesforce egy „új és mindenható” eszköz bevezetésével véget vet a Prompt- Gazdaságnak. Egy vállalat nemrégiben még „önmagát is lecserélte”, konkrétan az Adobe a Photoshop és a Lightroom implementációjával. A Photoshop egy csodálatos technológia volt és még mindig az. Ez és testvéralkalmazása, az Illustrator a grafikai tervezés generációit táplálta. A fotósok azonban nehéznek találták az intenzív gyorsbillentyűket és a nem éppen kreatív felületeket. Az évek előrehaladtával a Lightroom a Photoshop fotószerkesztési feladatainak jelentős részét felváltotta, ma már csak a »bonyolult műveletek« történnek így a Photoshopban. A Lightroom pedig a még egyszerűbb, mesterséges intelligenciával működő szerkesztőalkalmazások újabb generációjával néz most szembe, melyek közül sok okostelefonon végzi a hasonszőrű feladatokat és gyorsabban is.
A könnyebb, egyszerűbb és gyakran egyetlen kattintással elvégzett műveletek a technológia széles körű elterjedésének úttörő jellemzői. Amikor a generatív MI-lekérdezés jelentős felhasználói felület javulást ér el, a Prompt-Gazdaságnak bealkonyul, és végül majd megszűnik. A generatív MI boomja azonban ekkor már széles körű elfogadottságot fog elérni. Egy dolog biztos, a versenyképes technológiai ágazat ösztönözni fogja ezt az innovációt. Számos nagy technológiai szereplő áll most szemben az új generatív MI versenytársakkal. Őket arra késztetik, hogy saját MI-eszközöket építsenek vagy szerezzenek be, és azokat jelentősen fejlettebbé és könnyebben használhatóvá tegyék a meglévő felhasználóik és üzletfeleik számára. Az MI startupok következő hulláma is arra lesz így kényszerítve, hogy a ma még csírájukban létező generatív eszközöket felülmúlják jövőbe látó ötleteikkel. Nem az a kérdés tehát, hogy lesz-e, hanem az, hogy mikor látunk majd lényegesen egyszerűbb (és használhatóbb) következő generációs MI-eszközöket.