A Prithvi WxC olyan generatív mesterséges intelligencia-modell, amely akár a hétköznapi PC-ken is alkalmazható.
Az MI-alapú időjárás-előrejelzés ígéretes jövő előtt áll – szögezte le egy blogbejegyzésben az IBM. Egyes mélytanulási modellek, amelyeket történelmi időjárási adatokon képeztek ki, már most is képesek elérni a hagyományos időjárás-előrejelzési modellek teljesítményét. Ezek a klasszikus modellek hatalmas szuperszámítógépeken szimulálják a fizikai folyamatokat.
A NASA-val indított partnerségben azonban az IBM ambiciózusabb terveket dédelget. A cél az volt, hogy egy olyan generatív MI-modellt készítsenek, amely különböző térbeli léptékű, gyakorlati időjárási és éghajlati alkalmazásokhoz is igény szerint használható. Alig egy év elteltével a fejlesztés eredményét már meg is osztották az Oak Ridge National Laboratory közreműködésével a Hugging Face nevű oldalon.
A fejlesztés során mintegy negyven évnyi időjárási adatot tanítottak be a modellnek – ennek feldolgozása több tucat GPU-t és jó néhány hetet igényelt. A modell azonban már most számos célra alkalmazható, és akár egy asztali számítógépről is gyorsan hozzáférhető.
A lehetséges alkalmazások közé tartozik a célzott előrejelzések készítése a helyi időjárási adatokból, a szélsőséges időjárási események előrejelzése. Emellett a globális éghajlati szimulációk térbeli felbontását is javítani tudják a segítségével, valamint a fizikai folyamatokat is pontosabban képesek megjeleníteni a hagyományos időjárási és éghajlati modellekben.
Az egyik kísérlet során a modell az időjárási adatok egy apró, lokalizált mintájából pontosan rekonstruálta a globális felszíni hőmérsékletet, a hiányzó értékek 95 százalékát kitöltve.
Három alapalkalmazással indultak
Az új időjárási és éghajlati alapmodellt bemutató tanulmányukban a kutatók leírták, hogyan építették fel a modellt, és hogyan finomhangolták azt speciális adatokon, hogy három, az előrejelzők számára azonnali jelentőséggel bíró alkalmazást hozzanak létre.
Az első alkalmazás célja az alacsony felbontású adatok részletesebb kinagyítása volt – más néven a “downscaling” nevű módszer. Az időjárási és éghajlati előrejelzések lokalizálása révén ez a módszer még időben figyelmeztethet árvizekre és hurrikánokra.
A második alkalmazást hurrikán-előrejelzésre fejlesztették. A kutatók pontosan rekonstruálták az Ida hurrikán pályáját, amely 2021-ben csapott le Louisianára, és 75 milliárd dolláros kárt okozott. (Ezzel a negyedik legköltségesebb atlanti hurrikán volt a történelemben.) A jövőben ennek a modellnek a segítségével látható lesz, hol kell megerősíteni a közelgő hurrikánok elleni védelmet.
Az IBM és a NASA harmadik alkalmazása a gravitációs hullámok becslésének javítására szolgál. A Föld légkörében a gravitációs hullámok befolyásolják a felhőképződést és a globális időjárási mintázatokat, például azt, hogy hol jelennek meg a repülőgépek turbulenciái. A hagyományos éghajlati modellek nem képesek a gravitációs hullámokat nagy felbontásban megfelelően megragadni, ami bizonytalanságot okoz az időjárási és éghajlati előrejelzésekben. Ez a globális ellátási láncok összehangolása szempontjából is jelentős változást hozhat.
Hibrid architektúra, szokatlan képzési rend
Az IBM a kanadai környezetvédelmi és éghajlatváltozási ügynökséggel együttműködve dolgozik a csapadék-előrejelzés alapmodelljének testreszabásán. Ennek során valós idejű radaradatokat használnak fel, hogy néhány órával előre, helyi csapadék-előrejelzéseket készítsenek. A fejlesztők reményei szerint az adatvezérelt -megközelítés potenciálisan kevesebb számítási erőforrást használhat, és pontosabb eredményeket szolgáltathat.
Ez az új időjárási és éghajlati alapmodell a nyílt forráskódú modellek egyre növekvő családjához csatlakozik, amelyek célja, hogy a NASA műholdas és egyéb földmegfigyelési adatgyűjteményét gyorsabbá és könnyebben elemezhetővé tegye. A modell rugalmasságát hibrid architektúrájának és szokatlan képzési rendjének köszönheti.
A modell látástranszformátorra és maszkolt automatikus kódolóra épül, ami lehetővé teszi, hogy a modell időben kibontakozó térbeli adatokat kódoljon. Figyelemmechanizmusának az időre való kiterjesztésével a modell képes elemezni a MERRA-2 reanalízis adatait, amelyek több megfigyelési adatfolyamot integrálnak.
A modell emellett képes gömbön is futni, ahogyan a hagyományos rácsos éghajlati modellek teszik, és sík, téglalap alakú felületen is. Ez a kettős ábrázolás lehetővé teszi, hogy a modell ne a felbontás rovására váltson globális és regionális nézetek között.
A képzés során a kutatók a modellt rácshálós, erősen elsötétített éghajlati elemzési adatokkal táplálták, és a modell pixelről pixelre rekonstruálta az egyes képeket.
„A modell hatékonyan megtanulja, hogyan fejlődik a légkör az idő múlásával” – mondta Johannes Schmude, az IBM kutatója. Annak, hogy a modellt megkérték, rakja össze a hiányos időjárási adatokat, és képzelje el a jövőbeli állapotot, két előnye is volt. Felére csökkentette a kutatóknak a modell betanításához szükséges adatmennyiséget, csökkentve ezzel a GPU- és energiafogyasztást. Emellett megtanította a modellt arra is, hogyan töltse ki a hiányzó információkat, mind a jelen pillanatban, mind a jövőre nézve. Lényegében ezt teszik az időjárás-előrejelzők is.
(Kép: Pexels.com/Caio)