Mindenki azt hiszi, hogy ma már az összes cég is alkalmazza és ki is használja az MI-t (vagy legalább kísérletezik vele), de a valóságban a legtöbb vállalat nem így tesz. Azok, melyek igen, néha olyan MI-kezdeményezéseket tesznek, melyek köszönő viszonyban sincsenek az üzleti céljaikkal. A mesterséges intelligencia divat hatására talán látszólag úgy tűnik, hogy mindenki igyekszik egyedi stratégiát bevetni a technológia kihasználására, de ha a vezetés nem tudja, mi is a célja, nem biztos, hogy látják is az előnyeit.
A kis nyelvi modellek felemelkedése
Az elmúlt néhány évben a mesterséges intelligencia képességeinek robbanásszerű fejlődését láthattuk, melynek nagy részét a nagy nyelvi modellek (LLM) fejlődése okozta. Az olyan modellek, mint a GPT-3 megmutatták, hogy képesek emberhez hasonló szövegek generálására, kérdések megválaszolására, dokumentumok összegzésére és még sok másra. Miközben azonban az LLM-ek képességei lenyűgözőek, hatalmas méretük a hatékonyság, a költségek és a testreszabhatóság hátrányaihoz vezet. Ez megnyitotta az utat a modellek egy új osztálya, az úgynevezett kis nyelvi modellek (SLM) előtt.
A nagy nyelvi modellek múltja és jövője
Öt nap. Ennyi időbe telt, amíg a ChatGPT elérte az 1 millió aktív felhasználót. A természetes nyelvfeldolgozásban közel 50 évnyi innováció kellett ahhoz, hogy multimodális „érvelő szörnyeket” hozzunk létre. Ezek az eszközök nemcsak elbűvölték, hanem meg is rémítették a közönséget lenyűgöző képességeikkel és hatékonyságukkal, valamint potenciálisan veszélyes következményeikkel, ha nem szabályozzák őket megfelelően. Hol kezdődött tehát mindez, és hová tart ez az egész?