2024 a multimodalitás éve a szöveget, képet, videót és más kimeneteket generáló modelleknél. Elmúlnak azok az idők, amikor csak szövegből csak szöveget, képet és esetleg videót lehetett előállítani. Többféle bemenettel és kimenettel elboldogulnak, a világcsúcsot most döntötte meg egy modell.
Itt a GPT-4o Mini
Az OpenAI alacsony áron tette hozzáférhetővé multimodális, azaz szöveget, képet, videó- és audióanyagot generáló zászlóshajója, a GPT-4o karcsúbb, mini változatát.
Új multimodális modelleket mutatott be az Anthropic
A generatív mesterséges intelligenciában a Claude nagy nyelvmodellel híressé vált Anthropic bemutatta a harmadikgenerációs, multimodális változatát. A modell csúcskategóriás, több viszonyítási pont megmérettetésben az OpenAI és a Google legfejlettebb rendszereit is maga mögé utasította. Nagyon izgalmas időket élünk mesterséges intelligencia terén.
A mesterséges intelligenciában is minden a kontextusról szól
A Google zászlóshajónak számító generatív mesterséges intelligencia, a Gemini legutóbb frissített változata kolosszális terjedelmű inputtal képes dolgozni, de a létrehozott tartalom egyes esetekben igencsak megkérdőjelezhető, megmosolyogtató. A techóriás dolgozik a hibák korrigálásán.
Jön a mesterséges intelligencia igazi „gyilkos alkalmazása”?
Egy kínai startup átírhatja a generatív mesterséges intelligenciás kutatásfejlesztés erőviszonyait. A cég alapítója az MI egyik nemzetközi úttörője. Bizakodik benne, hamarosan elkészülnek egy minden piacot meghódító, a technológiát végképp mainstreammé tevő alkalmazással.
Immár Gemini néven a Google chatbot rákapcsol a nagy nyelvi versenyben
Bard néven indult, a Google most átnevezte chatbotját. Az Iker-csillagképet felidéző Gemini körül nagy a felhajtás, de ez nem a szokásos hype: a Google Asszisztens nyugdíjazásához vezető komoly előrelépésről van szó. Kérdés, hogy ez mire lesz elegendő a nagy nyelvmodellek közötti versenyfutásban, a Google kontra Microsoft meccsen.
A GPT-4V kreatívabb, és profin követi az utasításokat
A több módban működés, a multimodalitás megváltoztatja a nagy mesterségesintelligencia-modelleket. A rendszerek jobban értik az utasításokat, szövegek és képek társítását, összességében pedig kreatívabbak.
Generatív MI, mint fejlesztői platform
Az OpenAI a generatív mesterséges intelligencia forradalmának élharcosa. Most ismét nagyot újított, mert frissítéseivel, termékei kibővített funkcióival, nóvumaival szélesebb körben teszi elérhetővé a technológiát, a fejlesztőknek gyorsabban és olcsóbban kínál új alkalmazásépítési lehetőségeket. Alighanem ez a jövő útja.
Úgy lát a Google robotagya, mint ahogy a ChatGPT jobb napjaiban írja a szövegeket
A már-már követhetetlen tempójú mesterségesintelligencia-versenyfutás legújabb fontos lépése a Google vizuális-nyelvi modelljét karral felszerelt robotrendszerként hasznosító technológiája. A rendszer nem felejt, amivel közelebb kerültünk az általános mesterséges intelligenciához.