A világ legnagyobb közösségi médiavállalata azt tervezi, hogy ha a tesztelés jól megy, akkor a széles körű használatra gyártja majd a chipet – tudta meg a Reuters.
A végső állomás: saját chip
A házon belüli chipek fejlesztése része a Meta hosszú távú tervének, hogy csökkentse infrastrukturális költségeit.
A Meta, amely az Instagram és a WhatsApp tulajdonosa is, 2025-re 114-119 milliárd dolláros teljes kiadást prognosztizált. Ebből az összegből akár 65 milliárd dollárral is részesedhetnek az MI-infrastruktúrára fordított kiadások.
A Meta új oktatóchipje egy dedikált gyorsító, vagyis kizárólag MI-specifikus feladatok megoldására tervezték. Ezáltal energiatakarékosabb lehet, mint az MI-munkaterhelésekhez általában használt integrált grafikus feldolgozóegységek (GPU-k).
A Meta a tajvani székhelyű TSMC chipgyártóval dolgozik együtt a chipgyártásban érdekében. A tesztüzem azután kezdődött, hogy a Meta befejezte a chip első “tape-out”-ját. Ez a chipfejlesztésben a siker egyik jelentős fokmérője, amely magába foglalja a kezdeti terv chipgyáron való átküldését.
Egy tipikus tape-out több tízmillió dollárba kerül, és nagyjából három-hat hónapig tart. Ebben a fázisban semmi garancia arra, hogy a teszt sikeres lesz. Egy esetleges kudarc esetén a Metának diagnosztizálnia kell a problémát, és meg kell ismételni a tape-out lépést.
Évek óta döcög
A chip a vállalat Meta Training and Inference Accelerator (MTIA) sorozatának legújabb tagja. A program évek óta döcögősen halad, egy alkalommal a fejlesztés hasonló fázisában már kukáztak egy chipet.
A Meta tavaly elkezdett egy MTIA chipet használni egy MI-rendszer futtatására. A lapkát akkor az ajánlási rendszereknél vetették be – ezek határozzák meg, hogy mely tartalmak jelenjenek meg a Facebook és az Instagram hírfolyamában.
A Meta menedzsmentje szerint 2026-ra már szeretnék elkezdeni saját chipjeik használatát a képzéshez. Ez egy rendkívül számításigényes folyamat, amelynek során az MI-rendszert rengeteg adattal táplálják a tanulás közben.
A cég vezetői szerint az “érvelő” chiphez hasonlóan a “tréning-chip” esetében is az a cél, hogy az ajánlórendszerekkel kezdjék, és később olyan generatív MI termékekhez használják, mint a Meta AI chatbot.
“Azon dolgozunk, hogy hogyan végezzük el az ajánlórendszerek képzését, majd végül hogyan gondolkodjunk a generikus MI képzéséről és következtetéséről” – mondta Chris Cox, a Meta termékigazgatója a Morgan Stanley múlt heti technológiai, média és telekommunikációs konferenciáján.
A Meta korábban leállította egy saját fejlesztésű, egyedi következtető chip fejlesztését, miután az megbukott egy kis léptékű tesztüzemben. Ezt követően a Meta 2022-ben több milliárd dollár értékben adott le rendelést Nvidia GPU-kra.
Mennyi az annyi?
A közösségi médiavállalat azóta is az Nvidia egyik legnagyobb ügyfele, és valódi GPU-arzenállal rendelkezik a modellek betanításához.
Az egységek deduktív műveleteket is végeznek annak a több mint hárommilliárd embernek, akik naponta használják a Meta alkalmazásait.
Ezeknek a GPU-knak az értéke azonban többen is megkérdőjelezik. MI-kutatók egyre szkeptikusabban azzal kapcsolatban, hogy mennyi előrelépés érhető el a nagy nyelvi modellek folyamatos “skálázásával”, egyre több adat és számítási teljesítmény hozzáadásával.
Ezeket a kételyeket erősítette a kínai DeepSeek startup cég január végén bemutatott új, olcsó modelljei. Ezek a legtöbb, már piacon lévő modellnél nagyobb mértékben a deduktív funkciókra támaszkodva optimalizálják a számítási hatékonyságot.
A DeepSeek által kiváltott globális hullámvölgyben az Nvidia részvényei egy ponton értékük egyötödét is elvesztették. Ennek az értéknek nagy részét visszaszerezték, és a befektetők többsége is arra számít, hogy az Nvidia chipjei maradnak a képzés és az érvelés iparági szabványai.
(Kép: unsplash.com/Julio Lopez)