A Techcrunch már idén februárban írt arról, hogy hamarosan érkezhet a GPT új generációja, ám a portál akkor még azt a lehetőséget emelte ki, hogy lényegesen felgyorsul az új technológiával a mesterséges intelligencia válaszadása a keresésekre. Ez egyébként érthető törekvés, hiszen a Microsoft új frontot nyitott a keresőháborúban és a Bingbe integrálva a ChatGPT-t igyekszik megszorongatni az ezen a területen hatalmas fölénnyel vezető Google-t.
A német heise.de múlt csütörtökön publikált egy cikket, amelyben egy hibrid eseményről számoltak be, amelyek a Microsoft Germany 4 munkatársa is részt vett. A „KI im Fokus – Digitaler Kickoff” (MI a fókuszban – digitális kezdőrúgás) című rendezvényen a nagy nyelvi modellekről beszéltek a cég képviselői, illetve bemutatták az Azure-OpenAI ajánlatukat is. Az egyik résztvevő, Andreas Braun a Microsoft Germany műszaki igazgatója beszélt a GPT-4 közelgő megjelenéséről.
„Jövő héten mutatjuk be a GPT-4-et, amelyben multimodális modellek lesznek, amelyek teljesen más lehetőségeket, például videókat kínálnak majd” – idézte a heise.de Andreas Braunt, aki a mesterséges intelligencia és a ChatGPT alkalmazási lehetőségeiről beszélt. A szakember a nagy nyelvi modelleket „game changer”-nek nevezte, mivel ezek megtanítják a gépeket a természetes nyelv megértésére. A gépek ezután statisztikai úton megértik azt, ami korábban csak az emberek számára volt olvasható és érthető. Időközben a technológia annyira fejletté vált, hogy „elvileg minden nyelven működik”: feltehetünk egy kérdést németül, és kaphatunk választ olaszul. A multimodalitással a Microsoft és az OpenAI a nagy nyelvi modelleket is „átfogóvá teszi”.
Azt ugyanakkor pontosabban nem részletezték, hogy mit jelent például a „szövegből videót” képesség. A Google és a Meta is megjelent már olyan megoldással, ami képes szöveges inputok alapján videót készíteni, vagyis a ChatGPT ezzel a funkcióval csak felzárkózna a riválisokhoz. Kérdés, hogy milyen extra lehetőségeket kínál majd a GPT-4 és a hangsúlyozott multimodalitás. Ha például nem csak új videókat lehet majd létrehozni, hanem már meglévő videókat is lehet szöveges utasítások alapján módosítani az MI segítségével, az valóban új távlatokat nyithat, de természetesen aggodalomra is okot adhat, hiszen így minden eddiginél egyszerűbb lenne deepfake videókat készíteni.
Sem a Microsoft, sem az Open AI nem nyilatkozott a heise.de által nyilvánosságra hozott és azóta számos portál által átvett információról. Az ugyanakkor tény, hogy a Microsoft március 16-án egy különleges rendezvényt tart Satya Nadella vezérigazgató és az egyik alelnök, Jared Sparato részvételével. Az esemény fókuszában pedig a meghívó alapján az lesz, hogyan tudja újradefinálni a hatékonyságot a mesterséges intelligencia a munka világában.