Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Kínai chipek fogják hajtani a feltupírozott DeepSeeket

A DeepSeek mögött álló MI-startup szerint Kína hamarosan saját fejlesztésű, új generációs chipekkel fogja támogatni nagy nyelvi modelljeit. Mindeközben a cég bejelentette egyik LLM-jének frissítését is.

A vállalat hivatalos WeChat-fiókján egy bejegyzés alatti kommentben jelentette be a DeepSeek új V3.1 modelljét. Az LLM “UE8M0 FP8” precíziós formátuma kifejezetten azokra a hamarosan megjelenő hazai gyártású chipekre lett szabva, amelyek már a “következő generációt” képviselik.

Ébredezik a kínai MI-ökoszisztéma

Az FP8, vagyis 8 bites lebegőpontos formátum egy adatfeldolgozási módszer, amely javíthatja a számítási hatékonyságot. Ez a metódus a nagyméretű mélytanulási modellek tanítása és futtatása során érhető tetten.

A DeepSeek információ-csepegtetése Kína következő generációs chipjeiről arra utalhat, hogy a vállalat szorosabban kíván együttműködni Kína ébredező MI-chip ökoszisztémájával.

Különösen annak fényében, hogy Washington korlátozza a fejlett félvezetők exportját, Peking pedig önellátásra törekszik a chip-iparban – írja a CNBC.

Egyes hírek szerint Peking két hete állítólag felszólította a kínai MI-fejlesztőket: használjanak hazai alternatívákat az Nvidia grafikus processzorai helyett.

Inkább a hazait

Az Nvidia chipjei mindeddig kulcsszerepet játszottak az MI-modellek képzésében. Elemzők szerint a kínai chipgyártók technológiailag és méretgazdaságosságban még elmaradnak az Nvidiától.

Az olyan kínai játékosok azonban, mint a Huawei, folyamatosan fejlődnek.

A DeepSeek bejegyzésében azt nem árulta el, milyen chipeket használt a V3.1 tanításához. Ahogy azt sem, hogy az UE8M0 FP8 pontosan mely hazai chipekkel lehet kompatibilis.

A DeepSeek már az év elején felforgatta a tech-világot azzal, hogy kiadta az R1 érvelő modellt.

Kevésbé fejlett chipeken is jól képzett modell

A kínai startup LLM-je képességeiben összevethetőnek bizonyult a nyugati riválisok, például az OpenAI fejlesztéseivel.

Még annak ellenére is, hogy az amerikai exportkorlátozások miatt a kínaiak nem használhatták a legfejlettebb Nvidia chipeket az R1 képzéséhez.

Ezt megelőzően, még tavaly decemberben a cég bemutatta a V3 modellt, amelyet mintegy kétezer darab, kevésbé fejlett Nvidia-chipen tanítottak.

A DeepSeek modelljeinek áttörése után az Egyesült Államok áprilisban tovább szigorította az exportkorlátozásokat, gyakorlatilag betiltva a kifejezetten Kínának tervezett Nvidia H20 chipek exportját is.

A H20-dilemma

Múlt hónapban a Trump-adminisztráció jelezte, hogy engedélyezné az Nvidia számára a chipek újbóli szállítását Kínába. 

Ugyanakkor Kína váratlan ellenlépéssel reagált. Így a H20-as chipek jelenleg “vizsgálat alatt állnak” Kínában.

A hírek szerint a hatóságok mintegy megtiltották a kínai cégeknek a H20-chipek beszerzését mindaddig, amíg a nemzetbiztonsági felülvizsgálat le nem zárul.

Elemzők szerint az olyan cégek, mint a Huawei, alternatív chip-ökoszisztéma kiépítésén dolgoznak Kínában. Vagyis az Nvidia H20-asainak tiltásából ők komolyan profitálhatnak majd. 

A DeepSeek csütörtökön hozzátette, hogy a V3.1 modell “jelentős változásokat” – például gyorsabb válaszidőt és hibrid érvelési architektúrát – hoz majd a piacra. 

Ez azt is lehetővé teszi majd, hogy a modell érvelési és nem érvelési módban is működjön. 

(Kép: Unsplash/Solen Feyissa)

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek

ICT Global News

Iratkozz fel a hírlevelünkre, hogy ne maradj le az IT legfontosabb híreiről!