A 2023-ban bemutatott Maia 100 utódjaként érkezik a Microsoft új procija. A lapkát műszaki szempontból úgy alakították ki, hogy nagy teljesítményű MI-modelleket futtasson – csak éppen gyorsabban és hatékonyabban.
Nagyobb, szebb, jobb
A Maia 200 chip több mint százmilliárd tranzisztort tartalmaz, és 4-bites pontosság mellett több mint 10 petaflop, míg 8-bites pontosság mellett körülbelül 5 petaflop teljesítményt nyújt. Márpedig ez komoly javulást jelent az előző generációhoz képest – mutat rá beszámolójában a TechCrunch.
A chipet valójában az MI-inferencia skálázására tervezték. Ez azt a számítási folyamatot jelenti, amikor egy, már betanított modellt futtatnak – szemben a tanításhoz szükséges számítási kapacitással.
Ahogy az MI-cégek érettebbé válnak, az inferencia költségei egyre nagyobb szeletet hasítanak ki az összes működési költségből. Ez pedig újabb optimalizációs igényeket hív életre.
Kulcs az optimalizáláshoz
A Microsoft szándéka és tervei szerint a Maia 200 ennek az optimalizálásnak kulcsfontosságú eleme lehet.
A Maia 200 lehetővé teszi, hogy az MI-alapú szervezetek kevesebb fennakadással és alacsonyabb energia-felhasználással működjenek.
“A gyakorlatban egyetlen Maia 200 csomópont gond nélkül képes futtatni a mai legnagyobb modelleket. Sőt, emellett még bőséges tartalékkal is rendelkezik a jövőben megjelenő, még nagyobb modellek számára” – közölte a vállalat.
A Microsoft új chipje egy szélesebb iparági trendbe is illeszkedik.
Átterelt függőség
A tech-óriások egyre inkább a saját tervezésű chipek felé fordulnak, hogy csökkentsék függőségüket az Nvidiától. A cég csúcskategóriás GPU-i kulcsszerepet játszanak az MI-cégek sikerében.
A Google például a TPU-kat (Tensor Processing Unit) használja. Ezeket nem különálló chipekként értékesíti, hanem felhőn keresztül elérhető számítási kapacitásként.
Az Amazonnál ott van a Trainium, az e-kereskedelmi óriás saját MI-gyorsító chipje. Ennek legújabb verziója, a Trainium3 tavaly decemberben jelent meg.
Ezekben az esetekben a TPU-k és a Trainium chipek lehetővé teszik, hogy a számítási feladatok egy részét leváltsák az Nvidia GPU-iról, ezáltal csökkentve az összes hardverköltséget.
Újratervezett versenypozíció
A Maia révén a Microsoft is ebbe a versenybe pozicionálja magát. A cég hétfői sajtóközleménye szerint a Maia háromszoros FP4 teljesítményt nyújt az Amazon harmadik generációs Trainium chipjeihez képest, míg FP8 teljesítményben felülmúlja a Google hetedik generációs TPU-ját.
A Microsoft szerint a Maia már most is aktívan dolgozik a vállalat Superintelligence csapatának MI-modelljein.
Mindemellett támogatja a Copilot, a cég saját chatbotjának működését is.
A hivatalos tájékoztatás szerint fejlesztőket, akadémiai kutatókat és élvonalbeli MI-laborokat is felkértek, hogy saját munkaterheléseikhez használják a Maia 200 szoftverfejlesztői készletét (SDK).
(Kép: blogs.microsoft.com)