A nagy nyelvmodellek költségei

Kömlődi Ferenc

2023. aug 21.

MEGOSZTÁS

nagy nyelvmodellek Hugging Face Google gépi tanulás

A mesterséges intelligencia egyik kulcsterülete, a generatív MI-t működtető nagy nyelvmodellek iránti keresletnövekedés miatt a működtetési költségek is a csillagos égbe szöknek. Nincs megállás, gőzerővel pörög a verseny.

(Képek: Rawpixel, Pixabay)

A most zajló mesterségesintelligencia-forradalom a nagy nyelvmodelleken (LLM) alapul. A körülöttük lévő óriási felhajtás közepette a rendszerek nagyarányú kiszolgálásának költségeiről azonban kevesebbet cikkez a világmédia, pedig éppenséggel lenne miről. A chatbotok mainstreammé válásával a szolgáltatóknak ugyanis szembe kell nézniük a felhasználók folyamatosan növekvő száma miatti egyre masszívabb kiadásokkal.

A ChatGPT és más modellek alapját jelentő transzformer-architektúra ugyan gyors, de egyelőre rengeteg feldolgozás kell hozzá. Mechanizmusai számításigényesek, a teljesítmény értelemszerűen nagyobb paraméterszámmal és méretesebb adatsorokkal folyamatosan növelhető. Csakhogy ezek együtt a fejlesztőket a számítási költségvetés növelésére ösztönzik. Ha nem lesznek komoly változások, a trend érvényben marad a következő években.

Akkor is megéri, ha momentán nem éri meg

Néhány példa.

Clem Delangue, a Hugging Face vezérigazgatója elmondta, hogy egy LLM kiszolgálása általában többe kerül, mint amennyit a felhasználók fizetnek.

Egy, februári becslés alapján az OpenAI 0,0036 dollárt költ minden egyes GPT-3,5 szöveges utasítás (prompt) feldolgozására. Ezt az árat figyelembe véve, ha a Google a GPT-3,5-öt használva, igyekezne megválaszolni a keresőmotorja által másodpercenként kapott közel 320 ezer lekérdezést, 55,5 milliárd dollárról 19,5-re csökkenne a nagyvállalat éves működési (fő üzleti tevékenységéből származó) bevétele. A különbség óriási, és a nagyvállalat tesz is azért, hogy ne legyen így.

Ugyanis szintén februárban a feldolgozási költségeken való spórolást jelölte meg elsőszámú okként azért, amiért a Bard chatbot viszonylag kisebb LLM-en, a LaMDA modellen alapul.

Nagy nyelvmodellt mindenbe!

A chatbotok iránti növekvő kereslettel a modelleket nagymennyiségben feldolgozó GPU (grafikus feldolgozóegység) chipek iránti kereslet szintén nő. A kereslettel a chipek és a rájuk épülő felhőszolgáltatások költségei szintén emelkednek. (Tegyük még hozzá a chiphiányt.)

Az MI berobbanása eleve akkor érte az infokommunikációs szektort, amikor a technológiai mamutvállalatok között a korábbinál is élesebb lett a rivalizálás, amelynek legújabb állomásaként a nagy nyelvmodellek keresőmotorokba, elektronikus levelezőrendszerekbe, dokumentumszerkesztésbe és még sok más alkalmazásba, szolgáltatásba integrálásában versengenek egymással. Az érintett alkalmazások és szolgáltatások száma napról napra nő.

A fogyasztó minőségi kiszolgálása rövidtávú veszteségekkel jár, a piaci térnyeréshez azonban mindenképpen meg kell találniuk a kiadások és a bevételek helyes arányát.