Az utóbbi években a gyorsan fejlődő indiai ICT infrastruktúra a szubkontinens mesterségesintelligencia-piacát is megerősítette. Az ország masszív adatgazdasága, valamint a nagyléptékű kormányzati és vállalati befektetések fontos szerepet játszanak a digitalizációban, míg a következő években az MI-piac felhőszámítás-alapú alkalmazásokon alapuló növekedése várható, és az MI a döntéshozásban is egyre fontosabb szerepet fog játszani.
Mesterségesintelligencia-statisztikák
A mesterséges intelligencia jelenléte és piaci részesedése a nem infokom szektorok közül a bank- és pénzügyekben a legerősebb (ahol persze a csalás kockázata is megsokszorozódott), a gyártás a második, az infrastruktúra és a közlekedés a harmadik, a gyógyszeripar és az egészségügy a negyedik, a média- és a szórakoztatóipar az ötödik, a kiskereskedelem a hatodik. Az MI-piac hatvan százalékát a nagy IT-cégek jelentik, míg a nem IT-szektor a huszonhárom százalékát fedi le, startupoknak és oktatási szereplőknek viszonylag szűkös a tér. A gyártásban a robotok az összeszerelésben járnak élen, biztosítva a teljes termelői lánc működését. Az automatizált képfelismerő rendszerek szintén meghatározó szerepet töltenek be ezen a területen: minőségellenőrzéssel garantálják a precíziós munkát.
Mire használják az MI-t? (Kép: Analytic India Mag)
Az MI-gazdaság dinamikus fejlődését egy másik szám is szépen illusztrálja: a területen dolgozók 2018-ban az indiai kis- és középvállalatoknál a munkaerő 0,1 százalékát tették ki, 2022-ben viszont már 4,1-et. A mesterséges intelligencián belül a mélytanulás az elsőszámú szakterület, a természetesnyelv-feldolgozás, a számítógépes látás, a robotikus folyamat-automatizálás, a tudáshálók, az arcfelismerés, a megerősítéses tanulás, a beszélgető interfészek követik. Utolsó helyen a transzformerek, a virtuális ágensek és meglepő módon a generatív ellenséges hálózatok (GAN-ok) kullognak, az MI-t adoptáló vállalatok nulla százalékában vannak jelen, míg a mélytanulás közel háromnegyedüknél, de az első négy mind bőven meghaladja az ötven százalékot.
A mélytanulás óriási népszerűsége természetesen Indiában is annak köszönhető, hogy a technológiával az ember számára észrevétlen, rejtett tulajdonságok, mintázatok, kapcsolatok mutathatók ki az adatözönben. Különféle adatforrásokkal működik, a felsorolt területek közül nemcsak többel összefügg, hanem az alapjukat is jelenti. A következő években a technológia vállalati penetrációja folytatódni fog; minden jel arra utal.
Az indiai MI-piac fejlődése (Kép: Analytic India Mag)
Az MI felhasználási esetei közül a szolgáltatási tevékenység optimalizálása vezet, a prediktív szolgáltatás és beavatkozás a második, az ügyfél-szegmentáció a harmadik. Az MI-szakemberek 72 százaléka alapvető lekérdezési nyelvek, mint például az SQL segítségével kommunikál az adatbázisokkal, 64 százalékuk jól ismeri a mélytanulást, negyven százalékuk komoly szakértelemmel rendelkezik a felhőszámítások és a big data területén. A több mint tízéves szakma múlttal rendelkezők aránya húsz százalék, a kevesebb mint egy évvel tizennégy, az öt csoport közül a hat-tíz év a legnépesebb (közel huszonöt százalék).
Nagyvárosonkénti eloszlásban, MI-szakemberek körében a startup szcénát egyre jobban uraló Delhi a legnépszerűbb, 31 százalékuk dolgozik a fővárosban. A jó infrastruktúra, a hatékony közlekedési rendszer, a kormányhivatalok közelsége folyamatosan vonzza a befektetőket. A második Bangalore változatlanul őrzi IT-csomópont szerepét (23 százalék), de Mumbai is alig van lemaradva tőle (20 százalék). A negyedik-hatodik helyezett Hyderabad, Pune és Chennai, egyenként viszont már „csak” az MI-munkaerő tíz százalékát vagy kevesebbet tesz ki. Az éves keresetek Mumbaiban a legmagasabbak, Bangalore a második, Delhi a harmadik.
Nyelvtechnológiák
De hol tart ma a soknyelvű India az MI széleskörű elterjedését elhozó nagy nyelvmodellekkel (LLM)?
Egyes források szerint 730-at, mások alapján 456-ot beszélnek a közel másfél milliárd lakosú országban – előrejelzések szerint a vártnál hamarabb, talán már 2024-ben India lesz a világ legnépesebb országa –, közülük huszonhárom hivatalos, köztük az angol is. Ennek megfelelően a szubkontinens műszaki egyetemein egyre több generatív MI kutatási projektet indítanak azzal a céllal, hogy a ChatGPT-hez vagy a Bardhoz hasonló modellt fejlesszenek helyi nyelveken.
A nagyobb indiai nyelvek (Kép: Wikimedia Commons)
Az Elektronika és Információtechnológia Minisztérium szerint az MI az indiai növekedés „kinetikus ösztönzője”, a tudományos és felsőoktatási élet fontosabb szereplői viszont óvatosságra intenek, és a megfelelő nyelvi adatok összegyűjtésének nehézségeire, a projektek költségére és a szükséges irdatlan számítási kapacitásra figyelmeztetnek. Elmondásuk alapján legalább három éve dolgoznak ilyen kezdeményezéseken, de a hatalmas adatgazdaság ellenére, sajnos nincs elég hozzáférhető adat, kisebb nyelvek esetén pedig végképp siralmas a helyzet – panaszkodik szinte mindenki.
Nyelvi modellekhez a generatív MI-t megalapozó, az indiai vállalati szférában viszont kvázi a kutyát sem érdeklő transzformer architektúrát használják adatosztályozásra, lekérdezésre, gépi fordításra és chatbotok fejlesztésére. A Rourkela Nemzeti Technológiai Intézetben (NIT Rourkela) hindi, kannada és bengáli nyelven próbálnak modelleket kidolgozni. Ezeken a nyelveken és angolul válaszolnak a kérdésekre, és az NIT Rourkela rendszere az OpenAI eszközeinek használata nélkül is jó, még a GPT-4 angolról franciára történő fordításánál is jobb eredményeket ér el a hindi-angolnál.
Varanaszi, a szent város (Kép: Kömlődi Ferenc)
A Chennai Indiai Technológiai Intézetben is futnak hasonló projektnek, az egyik a Dél-Indiában legtöbbek által beszélt tamilra összpontosít, többek között YouTube videók pontosabb tamil fordítására törekednek. Az összehasonlítási alap mindig a GPT-4, és folyamatosan publikálnak anyagokat a videók indiai nyelvekre fordításáról.
A nyelvtechnológiákon túl
A Delhii Indiai Technológiai Intézetben 2022-ben az anyagtudományhoz dolgoztak ki nyelvmodellt, a beszédes nevű MatSciBert-et. MI segítségével kívánnak új anyagokat felfedezni, létrehozni. A modell első lépésben szakterületi publikációkat dolgoz fel és kivonatol. Tavaly közel százezerszer töltötték le, és különböző csoportok változatos feladatainak elvégzése során mindenki hasznosnak tartotta.
Az MI persze az indiai akadémiai szférában sem csak nyelvtechnológiákból áll, például a Guwahati Indiai Technológiai Intézetben alacsony költségen igyekeznek nyílt forrású képi adatbázisból gyűjtött arc- és a szemmozgásokból kiinduló vizuálisanimáció-modelleket készíteni, amelyekkel ezeket a mozdulatsorokat próbálják utánozni.
Varanaszi, Gangesz-part (Kép: Kömlődi Ferenc)
Az összes fejlesztésnél a számítási kapacitás a legnagyobb probléma – és nemcsak a szubkontinensen. A modelleknek egyre többre van szükségük, és sokan tartanak attól, hogy a tempó tarthatatlan, lelassulhat a gépi tanulás szélvészgyors fejlődése. Az NIT Rourkela például tizenhárom géppel, gépenként 24 GB GPU-val dolgozik, és már a GPT-3-al (hibák és újrapróbálkozás nélkül) 4,6 millió dollárba kerül egy gyakorlás. A felsőoktatás krémje és az indiai ICT topvállalatai kivételével egyetlen helyi szervezet sem engedheti meg magának e modellek rendszeres használatát. Több kutató álláspontja szerint, a projektek ellenére, korai indiai nyelveken működő modellekről beszélni, mert nagyon masszív számítási infrastruktúrát kellene előbb kiépíteni.
A problémát növeli, hogy az sem egyértelmű, kinek van jogosultsága a Fejlett Számítások Fejlesztési Központ által birtokolt, a világ nagyobb rendszereihez képes elmaradott indiai szuperszámítógép-infrastruktúrához.