A Gemini 2.0 az eddigi legerősebb mesterségesintelligencia-modell, ami eddig piacra került. A Google fejlesztése képes átvenni az irányítást a böngészők felett, hogy ugyanúgy navigálhasson a weben, mint egy ember. Ez alapvető változást hoz az internettel való interakcióban.
Szállást foglal, kódot ír
A Project Mariner néven futó fejlesztés a legnagyobb frissítés a népszerű böngészésben 34 évvel ezelőtti indulása óta. Szerves része a Google küldetésének. A cég technológiai óriásként olyan univerzális mesterséges intelligencia asszisztenst szeretne létrehozni, amely képes elvégezni a mindennapi feladatokat, legyen szó akár a nyaralások lefoglalásáról, akár a parkolójegyek kifizetéséről, akár kódok megírásáról.
A projekt korai szakaszában Chrome kísérleti bővítményeként jelenik meg. A cég Gemini mesterséges intelligenciáját használja a képernyőn megjelenő információk megértéséhez, illetve a szükséges lépések megtételéhez. A képpontok, képek, szövegek és webes űrlapok elemzésével a mesterséges intelligencia képes a megfelelő helyekre gépelni vagy kattintással végrehajtani a feladatokat. Igaz most még nem mindig tökéletesen.
Jelenleg csak korlátozott számú tesztelő számára érhető el a fejlesztés. A Google továbbá elismeri, hogy az elérhető verzió sokkal lassabb, mint az ember, és messze nem mindig megbízható. Az ígéretek szerint a ma mindig pontos, illetve lassú végrehajtás idővel gyorsan javulni fog.
A fejlesztők szerint ugyanakkor a Project Mariner paradigmaváltást hoz a felhasználói élményben, mert alapjaiban fogja változtatja meg a webhelyekkel és általában a technológiával való interakciót. A vállalkozások kénytelenek lesznek például jobban alkalmazkodni az AI kapcsolattartókhoz. Sőt, egész iparágak, például a reklámtevékenység is felborulhat, mivel az emberek többé nem látogatnak webhelyekre online hirdetések megtekintéséhez.
Valóban hasznos információk
A Project Mariner a Google mesterséges intelligencia kínálatának jelentős frissítésének részét képezi. Tavaly decemberi bevezetése óta a Geminit úgy tervezték, hogy multimodális legyen, vagyis képes megérteni az információkat szöveges, hang-, videó- és képbemeneteken keresztül. A legújabb verzió ezen keresztül is képes információt előállítani.
Sundar Pichai, a Google vezérigazgatója szerint a legújabb fejlesztések az AI „ügynökkorszakának” nevezett jelenséget képviselik, mivel a vállalat egy univerzális asszisztens létrehozásán dolgozik. Hozzátette, hogy feszegetik a mesterséges intelligencia határait, hogy világból származó információkat megfelelően rendszerezzék és csak a valóban hasznosakat tárják a felhasználók elé.