A vállalat hivatalos WeChat-fiókján egy bejegyzés alatti kommentben jelentette be a DeepSeek új V3.1 modelljét. Az LLM “UE8M0 FP8” precíziós formátuma kifejezetten azokra a hamarosan megjelenő hazai gyártású chipekre lett szabva, amelyek már a “következő generációt” képviselik.
Ébredezik a kínai MI-ökoszisztéma
Az FP8, vagyis 8 bites lebegőpontos formátum egy adatfeldolgozási módszer, amely javíthatja a számítási hatékonyságot. Ez a metódus a nagyméretű mélytanulási modellek tanítása és futtatása során érhető tetten.
A DeepSeek információ-csepegtetése Kína következő generációs chipjeiről arra utalhat, hogy a vállalat szorosabban kíván együttműködni Kína ébredező MI-chip ökoszisztémájával.
Különösen annak fényében, hogy Washington korlátozza a fejlett félvezetők exportját, Peking pedig önellátásra törekszik a chip-iparban – írja a CNBC.
Egyes hírek szerint Peking két hete állítólag felszólította a kínai MI-fejlesztőket: használjanak hazai alternatívákat az Nvidia grafikus processzorai helyett.
Inkább a hazait
Az Nvidia chipjei mindeddig kulcsszerepet játszottak az MI-modellek képzésében. Elemzők szerint a kínai chipgyártók technológiailag és méretgazdaságosságban még elmaradnak az Nvidiától.
Az olyan kínai játékosok azonban, mint a Huawei, folyamatosan fejlődnek.
A DeepSeek bejegyzésében azt nem árulta el, milyen chipeket használt a V3.1 tanításához. Ahogy azt sem, hogy az UE8M0 FP8 pontosan mely hazai chipekkel lehet kompatibilis.
A DeepSeek már az év elején felforgatta a tech-világot azzal, hogy kiadta az R1 érvelő modellt.
Kevésbé fejlett chipeken is jól képzett modell
A kínai startup LLM-je képességeiben összevethetőnek bizonyult a nyugati riválisok, például az OpenAI fejlesztéseivel.
Még annak ellenére is, hogy az amerikai exportkorlátozások miatt a kínaiak nem használhatták a legfejlettebb Nvidia chipeket az R1 képzéséhez.
Ezt megelőzően, még tavaly decemberben a cég bemutatta a V3 modellt, amelyet mintegy kétezer darab, kevésbé fejlett Nvidia-chipen tanítottak.
A DeepSeek modelljeinek áttörése után az Egyesült Államok áprilisban tovább szigorította az exportkorlátozásokat, gyakorlatilag betiltva a kifejezetten Kínának tervezett Nvidia H20 chipek exportját is.
A H20-dilemma
Múlt hónapban a Trump-adminisztráció jelezte, hogy engedélyezné az Nvidia számára a chipek újbóli szállítását Kínába.
Ugyanakkor Kína váratlan ellenlépéssel reagált. Így a H20-as chipek jelenleg “vizsgálat alatt állnak” Kínában.
A hírek szerint a hatóságok mintegy megtiltották a kínai cégeknek a H20-chipek beszerzését mindaddig, amíg a nemzetbiztonsági felülvizsgálat le nem zárul.
Elemzők szerint az olyan cégek, mint a Huawei, alternatív chip-ökoszisztéma kiépítésén dolgoznak Kínában. Vagyis az Nvidia H20-asainak tiltásából ők komolyan profitálhatnak majd.
A DeepSeek csütörtökön hozzátette, hogy a V3.1 modell “jelentős változásokat” – például gyorsabb válaszidőt és hibrid érvelési architektúrát – hoz majd a piacra.
Ez azt is lehetővé teszi majd, hogy a modell érvelési és nem érvelési módban is működjön.
(Kép: Unsplash/Solen Feyissa)