Google: elindult legerősebb Gemini – A modell jelentős következtetési fejlesztést kapott

Gábor János

2025. nov 20.

MEGOSZTÁS

A Gemini 3 új magasságokba emeli a nyelvi modellt. Csúcsra járnak a következtetési pontszámok, előzetesen megjelent a Deep Think mód.

Új lendület az AI-harcban: a Google nagy dobása lehet a Gemini 3, amit kedden jelentettek be, olyan ígéretekkel, hogy ez „az eddigi legerősebb következtetési és multimodális modell”. A fejlesztők szerint a technológia már egy új korszak fókuszában van, ugyanis ügynökszerű, mélyen interaktív AI.

Az új kiadású modell szinte minden fontos mérőszámban teljesítményugrást hoz, a matematikától a multimodális elemzésig.

A Google szerint a Gemini 3 Pro – amely előzetes verzióban jelent meg – már fogyasztói és fejlesztői termékek egész sorában elérhető. A korábbiaknál fejlettebb képességeket nyújt, és teszi ezt „gyorsabban, mint valaha”, hiszen teljes technológiai stackben közelít az AI-hoz.

„Két éve indítottuk a Gemini-korszakot, hihetetlen látni, hogy mennyire megszerették az emberek” – nyugtázta Sundar Pichai, a Google és az Alphabet vezérigazgatója.

A vállalat azt állítja, hogy az AI-alkalmazásának mára több mint 650 millió, míg a Google-keresések tetején megjelenő „AI-alapú áttekintésnek” kétmilliárd havi felhasználója van.

Felturbózták a Gemini következtetési teljesítményét

A Gemini 3 Pro minden fontos AI-benchmarkon lekörözi a 2.5 Prot – állítja blogbejegyzésben a Google. E szerint az új verzió vezeti az LM Arena ranglistát (1501-es Elo pontszámmal), és PhD-szintű következtetést mutat a Humanity’s Last Exam, valamint a GPQA Diamond legjobb eredményeivel.

A modell a szövegen túl is tovább viszi a multimodális következtetést: 81 százalékot ér el az MMMU-Pron és 87,6 százalékot a Video-MMMU-n. Emellett 72,1 százalékot hoz a SimpleQA Verified teszten, ami a tényszerű megbízhatóság javulását jelzi.

A Google szerint a Gemini 3 olyan okosabb, tömörebb és közvetlenebb válaszokat ad, amelyek „valódi meglátásokat” nyújtanak.

Ha ezt kóddal vezérelt, nagy hűségű vizualizációkkal párosítják, a rendszer azonnal lefordít bonyolult tudományos fogalmakat, vagy interaktív tanulóeszközöket készít.

Mély gondolkodás funkció

A Gemini 3 Pro mellett a Google előzetesen bemutatta a Deep Think módot, ami egy továbbfejlesztett következtetési üzemmód, még erősebb teljesítménnyel. Ez 41 százalékot ért el a Humanity’s Last Exam feladatsorán, 93,8 százalékot a GPQA Diamondon, és rekordot jelentő 45,1 százalékot az ARC-AGI-2-n mutatott kódvégrehajtással.

A Google szerint a Deep Think abban segít a modellnek, hogy több új és összetett kihívással birkózzon meg, mint valaha. „A Gemini minden generációja az előzőre épített, és ez egyre többet tesz lehetővé” – magyarázta Pichai.

A Gemini 3 hosszú kontextusú képességei, többnyelvű erősségei és multimodális szintézise most olyan tanulási munkafolyamatokat támogat, mint a videóelőadások elemzése, kézzel írt receptek fordítása, interaktív tanulókártyák kódolása, vagy akár pickleball-meccsfelvételek elemzése.

A Google a fejlesztőknek szánva elindította az Antigravityt is, ami egy ügynökalapú fejlesztői felület – az új modell következtetési és eszközhasználati képességei köré építve. A platform közvetlen hozzáférést ad az AI-ügynököknek a több lépcsőből álló autonóm végrehajtáshoz.

Erre építve a Gemini 3 az első helyre kerül a WebDev Arena ranglistán, 54,2 százalékot hoz a Terminal-Bench 2.0-n, és új csúcsot állít fel a SWE-bench Verified teszten is, 76,2 százalékkal.

Pichai szerint az új modell „összehozza a Gemini összes képességét, hogy bármilyen ötletet életre kelthess.” Hozzátette: a Gemini 3 „a következtetés élvonalába tartozik”, és jobban érti a felhasználói szándékot, így intuitívabb és segítőkészebb.

A Gemini 3 már meg is jelent az ismert alkalmazásban, ezenkívül a Search AI Mode-ban, az AI Studio-ban, a Gemini CLI-ben, a Vertex AI-ban és az Antigravityben. Pichai azt ígéri, „sok minden jön még”, vagyis hamarosan további modellek érkeznek a Gemini 3 sorozathoz.