(Kiemelt kép: Unsplash)
A chatbotok és más MI-alapú modellek, mint például a ChatGPT és az OpenAI egyre népszerűbbek az alkalmazások széles körében. Az egyik legnagyobb kihívás azonban, mellyel e modellek fejlesztése során szembe kell nézni, az a képesség, hogy létrehozzuk és betanítsuk őket arra, hogy a feladatok széles skáláját nagy pontossággal és hatékonysággal hajtsák végre. Itt jön a képbe a prompt mérnöki munka. A prompt tervezés egy olyan technika, melyet a modellek teljesítményének javítására használnak a betanításukhoz használt bemeneti adatok finomhangolásával. Ez magában foglalja az adatok gondos kiválasztását és strukturálását oly módon, hogy azok maximálisan hasznosak legyenek a modell képzéséhez. Milliók szenvednek most a nagy MI okozta hisztériás tüneteket is produkáló digitális betegségében: amikor is az MI-t antropomorfizálva és egy tényleges hús és vér embernek „vélve” egyfajta Messiásként ünneplik és áldják vagy szidják az egyre sokasodó önjelölt prófétái és hívei. Van még remény, hiszen a kicsit magukra valamit is adó „szakemberek és jövőkutatók” a ChatGPT, az OpenAI, a MidJourney és a GitHub CoPilot segítségével tényleges értelmes feladatokat is megoldhatnak a dolgos hétköznapokban, mintsem parasztot vakítanának az MI-t egyfajta cirkuszi Freakshow-nak beállítva podcastokban és videókban. Mert itt ugyanis azt tapasztalhatják meg azonban, hogy minél jobban fejlesztik az úgynevezett prompting készségeiket, annál jobb minőségű eredményeket látnak. Ez lenne ugyanis az a pont, ahol egy magára valamit is adó cég küszködik, és segítséget kér a mesterséges intelligencia használatához, hogy ténylegesen javítsa is vállalkozását.
Mi is az a Prompt Tervezés?
Igazából két kategóriát határozhatunk meg a prompt tervezésben: a meglévő MI-modellekhez, például az OpenAI-hoz vagy a MidJourney-hez intézett lekérdezések meghatározását, valamint a modellek felépítéséhez és képzéséhez szükséges mérnöki munkát. Mindkét besorolást tekintve meredeken nőni fog a kereslet a szakemberek iránt, akik segíthetnek a vállalkozásoknak a mesterséges intelligencia belső eszközök vagy termékek és szolgáltatások számára történő gyakorlati felhasználásában. Az OpenAI-hoz hasonló mesterséges intelligencia-modellekhez tartozó „súgók” megalkotása a technikai és kreatív készségek magas fokú kombinációját igényli. Ilyenkor egy kérdést, kijelentést vagy utasításkészletet állítanak össze egy MI-eszköznek, például a ChatGPT-nek. A szükséges kulcskompetenciák közé tartozik többek között: a mesterséges intelligencia és a gépi tanulás fogalmainak megértése. A hatékony felkérések elkészítéséhez fontos, hogy jól ismerjék a mesterséges intelligencia és a gépi tanulás mögöttes fogalmait és elveit, például a neurális hálózatokat, a természetes nyelvi feldolgozást és a mélytanulást. Az adott mesterséges intelligencia modell részletes ismerete: a hatékony súgók kidolgozásához fontos, hogy jól ismerjék az adott iparági mesterséges intelligencia modellt (nincs egy mindenre alkalmas „univerzális” modell ugyanis), mellyel dolgoznak, például az OpenAI GPT-3 vagy GPT-4 modell. Ez magában foglalja a modell architektúrájának, képzési adatainak, valamint a modell esetleges sajátos jellemzőinek vagy képességeinek ismeretét is. A feladat vagy alkalmazás tökéletes ismerete: A hatékony súgók kidolgozásához fontos, hogy jól ismerjük a feladatot vagy az alkalmazást, melyre a mesterséges intelligencia modellt adoptálni szeretnénk. Ez magában foglalja az adott terület, a felhasznált adatok típusának és a kívánt eredménynek az ismeretét is. Technikai készségek: Talán a legfontosabb, hogy jól ismerjük a mesterséges intelligenciamodellekkel való munkához szükséges „technikai készségeket”, a programozást, az adatok előfeldolgozását és a funkciótervezését is.
Végül, de nem utolsó sorban a kreatív készségek: a hatékony felkérések kidolgozásához szükséges a mesterséges intelligenciamodellekkel való munkához szükségesek kreatív készségeket is, mint például a „dobozon kívüli gondolkodás”, az új ötletek generálása és újszerű megközelítések kidolgozását. Nem hiányozhatnak a kommunikációs készségek sem egy Prompt Mérnök tárházából: a hatékony utasítások kidolgozásához lényeges, hogy jól ismerjük a kommunikációs készségeket, melyek szükségesek ahhoz, hogy hatékonyan kommunikáljuk a bemeneteket és a kívánt kimeneteket a mesterséges intelligenciamodell felé. Illetve az MI egyik rákfenéje még ma az eredmények elemzésének és értelmezésének „helyes” képessége: az eredményes felkérések kidolgozásához fontos, hogy képesek legyenek elemezni és értelmezni a mesterséges intelligencia modell eredményeit, hogy azonosítani tudják a problémákat vagy a fejlesztésre szoruló területeket belőlük. Összességében az OpenAI-hoz hasonló mesterséges intelligenciamodellek számára hatékony utasítások készítéséhez a technikai és kreatív készségek kombinációjára, valamint az adott modell és a feladat vagy alkalmazás mély megértésére van szükség. Ezek lennének egy optimális Prompt Mérnök jelölt feladatai és készségei 2023-ban.
A prompt tervezés tehát egy mélyebb, technikai jellegű területe a mesterséges intelligencia modellek képzéséhez használt bemeneti adatok finomhangolásának. Ez magában foglalja az adatok gondos kiválasztását és strukturálását oly módon, hogy azok maximálisan hasznosak legyenek a kívánt modell képzéséhez. Ez olyan technikákat foglalhat magában, mint az adatok előfeldolgozása, a jellemzők kiválasztása és az adatok bővítése. A prompt tervezés alkalmazásával javítható a mesterséges intelligencia modellek teljesítménye azáltal, hogy folyamatosan jobb minőségű bemeneti adatokkal látjuk el őket. Ez különösen hasznos olyan helyzetekben, amikor a rendelkezésre álló információk mennyisége korlátozott. Például az orvosi képalkotás esetében etikai vagy gyakorlati korlátok miatt nem biztos, hogy nagy mennyiségű adatot lehet gyűjteni. Ilyen esetekben a prompt tervezés segítségével a lehető legtöbbet lehet kihozni a korlátozottan rendelkezésre álló adatokból, ezek gondos kiválasztásával és strukturálásával oly módon, hogy azok maximálisan hasznosak legyenek a modell képzéséhez. A forrásadatok méretét mutatja, az OpenAI-t 45 milliárd dokumentumon, a MidJourney-t pedig több mint 4 milliárd képen képezték ki. Egy erősen specializált MI-modell, mint például az orvosi képalkotás, ehhez képest nagyon kis mintát jelent. Különösen akkor, ha egy vállalkozás tulajdonában lévő tényleges halmazra korlátozódik, nem pedig egy nyilvános adatforrásra.
Hogyan javíthatjuk az MI-modellek teljesítményét?
A Prompt Mérnök úgy javítja az MI-modellek teljesítményét, hogy jobb minőségű bemeneti adatokat generál folyamatosan számukra. Ez számos technikával érhető el, például az adatok előfeldolgozásával, a jellemzők kiválasztásával és az adatok bővítésével. Az adat előfeldolgozás a bemeneti adatok tisztításának és átalakításának folyamata, mielőtt azokat a modell betanításához használnák. Ez olyan technikákat foglalhat magában, mint a kiugró értékek eltávolítása, a hiányzó értékek kitöltése és az adatok normalizálása. Az ilyen módon történő előfeldolgozással javítható a modell teljesítménye azáltal, hogy tisztább és konzisztensebb adatokkal látjuk el. A jellemzők kiválasztása az a folyamat, melynek során a bemeneti adatokból kiválasztjuk a modell képzéséhez felhasználandó legrelevánsabb jellemzőket. Ez olyan technikákat foglalhat magában, mint a jellemzőkivonás, a jellemzőcsökkentés és a jellemzőkiválasztás. Így javítható a modell teljesítménye azáltal, hogy koncentráltabb bemeneti adatokkal látjuk el. Az adatbővítés a modell képzéséhez rendelkezésre álló adatok mennyiségének mesterséges növelése. A képek elforgatása, átfordítása és nagyítása, valamint zaj hozzáadása az adatokhoz. Az adatok ilyen módon történő bővítésével javítható a modell teljesítménye azáltal, hogy változatosabb bemeneti adatokkal tápláljuk azt.
A prompt mérnöki tevékenység egy nagyon új terület, melyre egyre nagyobb lesz a kereslet. Jelenleg a vállalkozások és a fogyasztók izgatottak a ChatGPT megjelenésével a közelmúltban létrehozott hatalmas és buta hisztéria miatt. Most még ott tartunk, hogy egy nagyon bonyolult és okos technológia mindenki számára hirtelen elérhetővé vált és láthatólag nem tudnak mit kezdeni vele. Ez az egyszerű hétköznapi használat viszont gyorsan növelheti a keresletet a képzett fejlesztők és mérnökök iránt is, akik segíthetnek az egyéni (tényleges üzleti hasznot is hozó) modellek létrehozásában, valamint a modellek lekérdezésének hatékony módjainak megteremtésében az üzleti fejlesztések valódi előmozdítása érdekében.