Képek: OpenAI
Az OpenAI San Franciscoban megtartotta első fejlesztői konferenciáját, és egy csomó újdonságot mutatott be rajta. Az újdonságok komoly segítséget jelentenek a vállalat generatív modelljeit használva alkalmazásokon dolgozó fejlesztőknek.
Turbómód
A bemutatott darabok között számos a frissítés, sok viszont jóval több szimpla frissítésnél. A frissített GPT-4 Turbo jelenleg a ChatGPT alapja, bővült a DALL-E 3 képgenerátorhoz, szövegből képet alkotó motorhoz, beszédfelismeréshez és ágens-stílusú lehetőségekhez való alkalmazásprogramozói interfész (application programing interface, API) hozzáférése. Emellett chatbotok, GPT-k új koncepcióját is ismertették.
A GPT-4 Turbo jelentős mértékben, a maximális 32 ezerről 128 ezerre növelte az egyszerre feldolgozható tokenek (jellegzetesen szavak vagy szórészek) számát. A modellnek így lehetőségében áll könyv hosszúságú kontextusok feldolgozása. Az API-k hozzáférési költsége a GPT-4 Turbo elődjeinek harmada, fele – persze többnek az ára esett az utóbbi időben.
A GPT-4 Turbo tartalmazza a fejlesztőknek használható szerkesztett adatokat biztosító JSON módot. A bétában újra létrehozható outputokkal a modell viselkedése konzisztensebb, ha a felhasználó véletlenszerűen vált egyik használatról a másikra. A valószínűséget naplózó eszközök a szekvencia következő tokenjének előrejelzésével segítik a fejlesztőket funkciók építésében.
Alkalmazásfejlesztőké a jelen és a jövő
Az új API-lehetőségekkel a fejlesztők jobban kihasználhatják a kép input-output, a szövegről beszédre fordító és a beszédfelismerő technológiákat. Az ágensszerűalkalmazások következtetnek feladatok megvalósításához szükséges szekvenciákról, kiviteleznek szekvenciákat.
Az új GPT-k egyedire kialakított, beszélgető interfészt használva és a store-ban a mobiltelefonos appokhoz hasonlóan terjesztve konfigurált chatbotok. A Canva például beszélgetésbe illeszthető grafikákat generáló GPT-t fejlesztett.
Az OpenAI új megoldásai azért figyelemreméltóak, mert a fejlesztők az eddiginél is szélesebb alkalmazási spektrumba építhetnek (mesterséges) intelligenciát. A GPT-4 Turbo 128 ezer tokenével nagyon kitágulnak a kontextus-feldolgozás lehetőségei, irdatlan input-mennyiségen követhető végig az információ.
A kibővített API-k nyelvi, vizuális és multimédia képességekkel rendelkeznek, míg az ágensszerű alkalmazások a változó környezetre reagálnak, és komplex módokon viselkednek. Jelentősen bővültek a fejlesztői lehetőségek.
Az OpenAI érdeme, hogy a csúcstechnológiás megoldások egyre szélesebb rétegeknek egyre rövidebb idő alatt válnak elérhetővé.