Új multimodális modelleket mutatott be az Anthropic

Kömlődi Ferenc

2024. ápr 4.

MEGOSZTÁS

Technológia Új technológiák Adatgazdaság Rövid hírek Felhő

multimodalitás Anthropic mesterséges inteligencia gépi tanulás chatbot nagy nyelvmodellek

A generatív mesterséges intelligenciában a Claude nagy nyelvmodellel híressé vált Anthropic bemutatta a harmadikgenerációs, multimodális változatát. A modell csúcskategóriás, több viszonyítási pont megmérettetésben az OpenAI és a Google legfejlettebb rendszereit is maga mögé utasította. Nagyon izgalmas időket élünk mesterséges intelligencia terén.

Az Anthropic több nagy multimodális modellt jelentett be. A Claude 3 három nyelv-kép modellből áll: a legnagyobb és legfejlettebb, legtöbbre kész Opusból, a nagyléptékű alkalmazásokhoz leginkább költséghatékony Sonnetből, valamint a japán zen-költészetet idéző, legkisebb, leggyorsabb és legolcsóbb Haikuból.

A paraméterek még ismeretlenek

Az Opus és a Sonnet a Claude alkalmazásprogramozói interfészén (API) keresztül érhető el az Amazon Bedrockján, illetve privát preview-ban a Google Felhőben. Az Opus a havi húsz dollárért előfizethető Claude Pro chatboton keresztül is hozzáférhető, míg a Sonnet a Claude ingyenes chatbotját üzemelteti.

A paraméterek egyelőre nem nyilvánosak, a modelleket nyilvános, saját és szintetikus adatokon gyakoroltatták. Az adatok közül a legfrissebbek 2023 augusztusából valók. Mintegy kétszázezer kontextus-tokent képesek feldolgozni, és az akár egymilliónak is helyet adó Opus teljesítménye a Google Gemini 1.5 Pro-jához hasonló.

Az Opus egymillió token inputnál 15, egymillió token outputnál 75 dollárba kerül. A Sonnet ugyanekkora inputjai 3, outputjai 15 dollár, míg az egyelőre nem elérhető Haikunál 0,25 és 1,25 dollár a két ár.

Csúcsteljesítmények

Az Opus több viszonyítási pont tesztnél (benchmark), nyelv, matematika, következtetés, általános tudás, kódgenerálás témákban csúcsteljesítményt ért el, az OpenAI GPT-4-ját és a Google Gemini 1.0 Ultráját is felülmúlta az LMSYS Chatbot Aréna Ranglistán.

A Sonnet tudományos diagrammok értelmezésében (AI2D) teljesített legjobban, ezen a téren már ő a viszonyítási pont. A GPT-4-et és a Gemini 1.0 Pro-t szintén több területen utasította maga mögé.

A Haiku a Chat Q&A-ben: a diagrammokra vonatkozó kérdések megválaszolásában brillírozott. Az esetek többségében jobb eredményeket ért el, mint a Gemini 1.0 Pro és a GPT-3.5.

GPT-4 osztály, a csúcs

Az Anthropic a biztonság növelése érdekében kezdte el finomhangolni a modelljeit, ami olyan jól sikerült, hogy a Claude változatai ma több kategóriában világelsők, ők a viszonyítási pont. A Claude 3 család pedig ezekhez a teljesítményekhez engedi hozzá kompetitív árakért a fejlesztőket. A szakma érdeklődéssel várja, hogy mit hoznak ki a modellből.

Jelenleg a GPT-4 „osztályba” tartozó, könnyen hozzáférhető nagy nyelvmodellek (large language models, LLM), azaz maga a GPT-4, a Gemini Pro és a Claude 3 a legfejlettebbek, ők a viszonyítási pont.

Egyre nagyobb nyomás nehezedik azokra a fejlesztőkre, akik modelljeikkel túl akarják szárnyalni őket.

(Képek: Anthropic)