Az Anthropic több nagy multimodális modellt jelentett be. A Claude 3 három nyelv-kép modellből áll: a legnagyobb és legfejlettebb, legtöbbre kész Opusból, a nagyléptékű alkalmazásokhoz leginkább költséghatékony Sonnetből, valamint a japán zen-költészetet idéző, legkisebb, leggyorsabb és legolcsóbb Haikuból.
A paraméterek még ismeretlenek
Az Opus és a Sonnet a Claude alkalmazásprogramozói interfészén (API) keresztül érhető el az Amazon Bedrockján, illetve privát preview-ban a Google Felhőben. Az Opus a havi húsz dollárért előfizethető Claude Pro chatboton keresztül is hozzáférhető, míg a Sonnet a Claude ingyenes chatbotját üzemelteti.
A paraméterek egyelőre nem nyilvánosak, a modelleket nyilvános, saját és szintetikus adatokon gyakoroltatták. Az adatok közül a legfrissebbek 2023 augusztusából valók. Mintegy kétszázezer kontextus-tokent képesek feldolgozni, és az akár egymilliónak is helyet adó Opus teljesítménye a Google Gemini 1.5 Pro-jához hasonló.
Az Opus egymillió token inputnál 15, egymillió token outputnál 75 dollárba kerül. A Sonnet ugyanekkora inputjai 3, outputjai 15 dollár, míg az egyelőre nem elérhető Haikunál 0,25 és 1,25 dollár a két ár.
Csúcsteljesítmények
Az Opus több viszonyítási pont tesztnél (benchmark), nyelv, matematika, következtetés, általános tudás, kódgenerálás témákban csúcsteljesítményt ért el, az OpenAI GPT-4-ját és a Google Gemini 1.0 Ultráját is felülmúlta az LMSYS Chatbot Aréna Ranglistán.
A Sonnet tudományos diagrammok értelmezésében (AI2D) teljesített legjobban, ezen a téren már ő a viszonyítási pont. A GPT-4-et és a Gemini 1.0 Pro-t szintén több területen utasította maga mögé.
A Haiku a Chat Q&A-ben: a diagrammokra vonatkozó kérdések megválaszolásában brillírozott. Az esetek többségében jobb eredményeket ért el, mint a Gemini 1.0 Pro és a GPT-3.5.
GPT-4 osztály, a csúcs
Az Anthropic a biztonság növelése érdekében kezdte el finomhangolni a modelljeit, ami olyan jól sikerült, hogy a Claude változatai ma több kategóriában világelsők, ők a viszonyítási pont. A Claude 3 család pedig ezekhez a teljesítményekhez engedi hozzá kompetitív árakért a fejlesztőket. A szakma érdeklődéssel várja, hogy mit hoznak ki a modellből.
Jelenleg a GPT-4 „osztályba” tartozó, könnyen hozzáférhető nagy nyelvmodellek (large language models, LLM), azaz maga a GPT-4, a Gemini Pro és a Claude 3 a legfejlettebbek, ők a viszonyítási pont.
Egyre nagyobb nyomás nehezedik azokra a fejlesztőkre, akik modelljeikkel túl akarják szárnyalni őket.
(Képek: Anthropic)