Új lendület az AI-harcban: a Google nagy dobása lehet a Gemini 3, amit kedden jelentettek be, olyan ígéretekkel, hogy ez „az eddigi legerősebb következtetési és multimodális modell”. A fejlesztők szerint a technológia már egy új korszak fókuszában van, ugyanis ügynökszerű, mélyen interaktív AI.
A Google szerint a Gemini 3 Pro – amely előzetes verzióban jelent meg – már fogyasztói és fejlesztői termékek egész sorában elérhető. A korábbiaknál fejlettebb képességeket nyújt, és teszi ezt „gyorsabban, mint valaha”, hiszen teljes technológiai stackben közelít az AI-hoz.
„Két éve indítottuk a Gemini-korszakot, hihetetlen látni, hogy mennyire megszerették az emberek” – nyugtázta Sundar Pichai, a Google és az Alphabet vezérigazgatója.
A vállalat azt állítja, hogy az AI-alkalmazásának mára több mint 650 millió, míg a Google-keresések tetején megjelenő „AI-alapú áttekintésnek” kétmilliárd havi felhasználója van.
Felturbózták a Gemini következtetési teljesítményét
A Gemini 3 Pro minden fontos AI-benchmarkon lekörözi a 2.5 Prot – állítja blogbejegyzésben a Google. E szerint az új verzió vezeti az LM Arena ranglistát (1501-es Elo pontszámmal), és PhD-szintű következtetést mutat a Humanity’s Last Exam, valamint a GPQA Diamond legjobb eredményeivel.
A modell a szövegen túl is tovább viszi a multimodális következtetést: 81 százalékot ér el az MMMU-Pron és 87,6 százalékot a Video-MMMU-n. Emellett 72,1 százalékot hoz a SimpleQA Verified teszten, ami a tényszerű megbízhatóság javulását jelzi.
Ha ezt kóddal vezérelt, nagy hűségű vizualizációkkal párosítják, a rendszer azonnal lefordít bonyolult tudományos fogalmakat, vagy interaktív tanulóeszközöket készít.
Mély gondolkodás funkció
A Gemini 3 Pro mellett a Google előzetesen bemutatta a Deep Think módot, ami egy továbbfejlesztett következtetési üzemmód, még erősebb teljesítménnyel. Ez 41 százalékot ért el a Humanity’s Last Exam feladatsorán, 93,8 százalékot a GPQA Diamondon, és rekordot jelentő 45,1 százalékot az ARC-AGI-2-n mutatott kódvégrehajtással.
A Gemini 3 hosszú kontextusú képességei, többnyelvű erősségei és multimodális szintézise most olyan tanulási munkafolyamatokat támogat, mint a videóelőadások elemzése, kézzel írt receptek fordítása, interaktív tanulókártyák kódolása, vagy akár pickleball-meccsfelvételek elemzése.

A Google a fejlesztőknek szánva elindította az Antigravityt is, ami egy ügynökalapú fejlesztői felület – az új modell következtetési és eszközhasználati képességei köré építve. A platform közvetlen hozzáférést ad az AI-ügynököknek a több lépcsőből álló autonóm végrehajtáshoz.
Erre építve a Gemini 3 az első helyre kerül a WebDev Arena ranglistán, 54,2 százalékot hoz a Terminal-Bench 2.0-n, és új csúcsot állít fel a SWE-bench Verified teszten is, 76,2 százalékkal.
A Gemini 3 már meg is jelent az ismert alkalmazásban, ezenkívül a Search AI Mode-ban, az AI Studio-ban, a Gemini CLI-ben, a Vertex AI-ban és az Antigravityben. Pichai azt ígéri, „sok minden jön még”, vagyis hamarosan további modellek érkeznek a Gemini 3 sorozathoz.