A kutatók egy mély neurális hálózatot – a mesterséges intelligencia egyik típusát, amely belülről köztudottan rejtélyes – vizsgáltak meg, egy jól megszokott matematikai elemzési módszerrel, amelyet a fizikusok és a mérnökök már száz éve használnak. A kutatók ez év elején tették közzé eredményeiket a PNAS Nexus folyóiratban, amelyek arra utalnak, hogy a mesterséges intelligencia ugyanazokat a számításokat végzi, mint amelyeket az emberek már régóta maguk is végeznek.
A cikk szerzői jellemzően mély neurális hálózatokat használnak szélsőséges időjárási események előrejelzésére vagy más éghajlati alkalmazásokra. Míg a jobb helyi előrejelzések segíthetnek az embereknek a szabadidejük ütemezésében, a széljárás és a felhők érkezésének előrejelzése, abban is segíthet a megújulóenergia-üzemeltetőknek, hogy megtervezzék, milyen forrásból hozzák az energiát a hálózatba az elkövetkező órákban.
„Egy ideje dolgozunk ezen a területen, és azt találtuk, hogy a neurális hálózatok valóban hatékonyak az ilyen típusú rendszerekkel való kezelésben” – mondja Pedram Hassanzadeh, a texasi Rice Egyetem gépészmérnöke és a tanulmány egyik szerzője.
Manapság a meteorológusok az ilyen jellegű előrejelzéseket gyakran olyan modellekkel végzik, amelyekhez óriási szuperszámítógépek szükségesek. A mély neurális hálózatoknak sokkal kevesebb feldolgozási teljesítményre van szükségük ugyanezen feladatok elvégzéséhez. Könnyű elképzelni egy olyan jövőt, ahol bárki futtathatja ezeket a modelleket egy laptopon, akár terepen is.
Ettől mély a neurális hálózat
A mesterséges intelligencia sokféle formában jelenik meg, a mély neurális hálózatok csak az egyik, bár nagyon fontos formája, amely három részből áll. Tegyük fel, hogy létrehozunk egy neurális hálózatot, amely azonosít egy állatot a képe alapján. Az első rész lefordíthatja a képet adatokká, a középső rész elemezheti az adatokat, az utolsó rész pedig összehasonlíthatja az adatokat egy állatlistával, és a legjobb egyezéseket adja ki.
A mély neurális hálózatot az teszi „méllyé”, hogy alkotói ezt a középső részt sokkal bonyolultabbá, több rétegből állóvá bővítik. Például egy képfigyelő mély neurális hálózat minden egyes rétege egymás után elemezheti a kép egyre összetettebb részeit.
Ez az összetettség teszi a mély neurális hálózatokat nagyon erőssé, és a közelmúltban a mesterséges intelligencia számos lenyűgöző teljesítményét is ezeknek köszönhetjük. Egyik első képességük több mint egy évtizeddel ezelőtt az emberi beszéd szavakra történő átírása volt. A későbbi években színezték a képeket, követték a pénzügyi csalásokat és terveztek gyógyszer-molekulákat. És ahogy Hassanzadeh csoportja bebizonyította, képesek megjósolni az időjárást és előrejelezni az éghajlatváltozást.
Sok tudós számára az a probléma, hogy valójában senki sem látja, mit csinál a hálózat, a hálózatok készítési módja miatt. Egy hálózatot úgy képeznek ki, hogy feladatot rendelnek hozzá, és adatokat szolgáltatnak neki. Ahogy az újszülött hálózat több adatot emészt fel, úgy alkalmazkodik a feladat jobb végrehajtásához. A végeredmény egy „fekete doboz”, egy olyan eszköz, amelynek belseje annyira össze van kódolva, hogy még a saját készítői sem érthetik meg teljesen.
A fekete doboz feltörése
Az AI-szakértők számtalan órát áldoztak életükből arra, hogy jobb módszereket találjanak alkotásaik megismerésére. Ezt már nehéz megtenni egy egyszerű képfelismerő hálózattal. Még nehezebb megérteni egy mély neurális hálózatot, amely egy olyan rendszert, mint például a Föld klímaadatait ropogtatja és amely számtalan változóból áll.
Ha a tudósok ismerik a neurális hálózatuk működését, nemcsak saját eszközeikről tudhatnak többet, hanem elgondolkodhatnak azon, hogyan adaptálják ezeket az eszközöket más célokra.
Így hát Hassanzadeh-nek és kollégáinak az az ötlete támadt, hogy a Fourier-analízist használják fel.
A Fourier-sorok vizsgálata nagyban hozzájárult az analízis fejlődéséhez. W. R. Wade amerikai professzor egy magyar nyelven megjelent nyilatkozatában a következőt mondta a Fourier-analízissel kapcsolatban: „A klasszikus harmonikus analízis, a Fourier-analízis gyökerei mélyre nyúlnak. Mondhatnám, Isten volt az első, aki Fourier-analízist művelt, amikor fülünkbe beépített egy Fourier-analizátort. Ugyanis már a gyermek is képes arra, hogy különbséget tegyen például a hegedű és a harsona hangja között. Annak ellenére, hogy a hangjegyek, amelyekkel a dallamot leírjuk, ugyanazok. Mi akkor a különbség a két hang között? Az, hogy amikor megszólaltatunk egy hangot, az sosem csupán tiszta hang, hanem több felhangból álló együttes. Kissé általánosabban fogalmazva: minden függvényben, ami egy hangzásnak megfelel, sok rejtett információ van, amit észlelni kell, s fülünk észlelni is tudja.”– Forrás: Hit, zene, matematika. Interjú W. R. Wade professzorral. Természet Világa 11 (114), 1986
Gondoljunk a Fourier-analízisre úgy, mint egy fordítási aktusra! A végső nyelv egy adathalmazt kisebb függvények összegeként ábrázol. Ezután bizonyos szűrőket alkalmazhatsz, hogy az összeg egyes részeit kitöröld és így láthasd a mintákat.
Az történt, hogy a kísérletük sikeres volt. Hassanzadeh és kollégái felfedezték, hogy az általuk használt neurális hálózat lényegében ugyanazoknak a szűrőknek a kombinációja, amelyeket sok tudós használna. Ha neki és kollégáinak igaza van a most publikált munkájukkal kapcsolatban, akkor az azt jelenti, hogy megnyitottak valamit – ami eddig varázslatnak tűnt –, egy olyan matematikai eszközzel, amelyet a tudósok már több mint egy évszázada használnak.