(Képek: Princeton Egyetem)
A mesterséges intelligencia, tökéletes önvezető járművek és más gépek gyakoroltatásához szükséges adatsorok létrehozására, hogy aztán ezek a szerkezetek jól láthassák környezetüket. Generatív MI-n alapuló rendszerek viszont pont környezeti képekben szenvednek hiányt, korlátozottak a lehetőségek és így, a használata is.
A Princeton Egyetem kutatói a problémát megoldó, gépek szinte bármilyen vizuális környezethez való alkalmazkodását segítő, a közeghez gyorsan megfelelő képeket generáló szoftvert fejlesztett.
Szintetikus környezetek, szintetikus objektumokkal
Az Infinigen nevű rendszer természetesnek tűnő tárgyakat és környezeteket hoz létre 3D-ben. Munkaintenzív gyűjtéssel összeszedett adatok manuális bevitele vagy mesterséges ideghálók helyett automatizált algoritmusokon alapul, és a 3D-s képalkotáshoz – rengeteg közeget és objektumot alkot – csak véletlenszerű matematikai szabályokat használ.
Fejlesztői korlátlan mennyiségű, változatos és élethű természetes jelenet létrehozására alkalmas, dinamikus programnak tartják. A matematikai megközelítés lehetővé teszi gépilátás-rendszerek gyakoroltatásához nélkülözhetetlen címkézett vizuális adatok elkészítését. 3D-világ létrehozásával kezdi, objektumokkal népesíti be és a képek készítéshez kamerát helyez a közegbe. Mivel programszerűen dolgozza ki az összes képet, mindegyikhez részletes címke kapcsolódik (kategória, helyszín stb.).
A felhasználó finomhangolhatja a rendszer beállításait – például a kameraszögeket, vagy a világítást –, amellyel a képeket még hasznosabbá teszi a gyakoroltatáshoz. A virtuális világok digitális tárgyainak formája, alakja, textúrája, színei, mind természetesek, és a természeti jelenségek, mint a köd, az eső vagy a hó szintetikus megjelenítése is az.
Alkalmazási lehetőségek
A szoftver alkalmazási lehetőségei széleskörűek: gépilátás-rendszerek gyakorlóadataihoz, kiterjesztett és virtuális valósághoz (augmented reality, virtual reality – AR és VR), játékfejlesztéshez, filmkészítéshez, 3D-nyomtatáshoz, sokféle tartalom előállításához jól használható. A kóddal bárki szabadon dolgozhat.
A programmal gépek 2D-pixelekből jobb 3D-anyagokat készítenek. Szintetikus adatsorok, fizikai környezetben működő önvezető autók és robotok fejlesztéséhez is hasznosabbak, mint a valódiak, mert a „valóvilág” képekből álló adatsorok korlátozottak. A számunkra 3D-s képek egy számítógépnek 2D-s pixelgyűjtemények és csak meghatározott utasítást követve láttatja őket 3D-ben, egy robottal. A mai 2D-s képekkel ezt nagyon nehéz megoldani – az Infinigen és hasonló rendszerek viszont tökéletesen alkalmasak rá. Ezért annyira ígéretesek a 3D-képekből álló szintetikus adatsorok.
A szoftverhez egyetlen fajta digitális objektumot (kutya, erdő stb.) előállító, generátor alprogramokat fejlesztettek. A felhasználó több paramétert, például méretet, textúrát, színt, visszatükröződést adhat meg hozzájuk. A valósághűséget növelve/csökkentve, úgy alakítja őket, ahogy akarja.