(Kiemelt kép: Unsplash )
Körülbelül kétszáz évvel ezelőtt a technológiai fejlődés olyan fordulatot vett, ami felesleges eszközök és technológiák megjelenéséhez vezetett. De azok a tényezők, melyek meghatározzák bármely találmány jövőjét, ugyanazok maradnak. Az Apple Vision Pro jövőbeli sikere vagy kudarca nem a technikai jellemzőkön múlik. A „Sikeres lesz-e az Apple Vision Pro?” kérdésre adott válasz nem a mikrokamerákon, érzékelőkön vagy megapixeleken múlik, hanem a felhasználók majdani affinitásán. Az Apple a Vision Pro-val ismét egy látomásos számítástechnikai eszközt mutatott be. Íme három ok, amiért a Vision Pro az iPad óta talán a legvizionáriusabb szórakoztatóelektronikai eszköz lehet.
Térbeli számítástechnika: egy újradefiniált ICT-paradigma
Bár a Vision Pro-t a kiterjesztett valóság és a virtuális valóság headsetjeként kategorizálták, az Apple térbeli számítástechnikai eszközként írja le. A bemutatón a Vision Pro-t a számítástechnika új dimenziójába vezető eszközként mutatták be. A virtuális vagy a kiterjesztett valósággal ellentétben, melyek továbbra is rosszul definiált és kissé homályos fogalmak, a térbeli számítástechnika (spatial computing) az új háromdimenziós ICT-keretrendszer alapvetőbb meghatározását adja. Átfogó volumetrikus paradigmát vezet be a számítástechnikai élményünkbe, forradalmasítva a médiafogyasztást, a munkavégzést és a társadalmi interakciókat. Az Apple a térbeli számítástechnika fogalmának felkarolásával – és merjük azt mondani, hogy meghatározásával – alapvetően új perspektívát kínál az információfeldolgozással és a médiafogyasztással való kapcsolatunkhoz. A kétdimenziósról a háromdimenziós paradigmára való áttérés jelentős, mivel szorosabban összehangolja a számítástechnikai élményt azzal, ahogyan az emberek érzékelik a világot és kapcsolatba lépnek vele, és a digitális világot a háromdimenziós fizikai világunkba hozza, még intimebb és magával ragadóbb módon. Míg korábban a világháló felszínén szörföztünk, a térbeli számítástechnika mélyebben becserkészi a világhálót a körülöttünk lévő tágas világba, végtelen lehetőségeket nyitva meg a magával ragadó, többdimenziós élmények számára.
Digitális valóság: a kiterjesztett valóságokon túl
A Vision Pro olyan koncepciót mutat be, mely túlmutat a hagyományos kiterjesztett és a virtuális világokon. Ahelyett, hogy a valóságot közvetlenül a szemünkön keresztül érzékelnénk digitális átfedésekkel, az Apple bevezetett egy digitális közvetítő réteget, mely megszűri a valóságot, mielőtt az a szemünkbe jutna. A környezetnek ez a digitalizálása a Vision Pro-t inkább a bionikus vagy kibernetikus szemüvegekhez teszi hasonlóvá. A szemünkbe érkező jelek elektronikusan generáltak, ami egyfajta átalakító ugrást jelent a világ érzékelésében és a világgal való interakcióban. Bár ez finom átmenetet jelent, de mégis messzemenő következményekkel jár. A Vision Pro lehetővé teszi továbbá a felhasználók számára, hogy digitális személyiséget hozzanak létre, egy digitális ikret, mely egy neurális hálózat segítségével utánozza gesztusainkat és viselkedésünket, hogy képviseljen minket, amikor távolról kommunikálunk másokkal. Ez a digitális „közvetítő réteg” a személyes interakciókra is kiterjed, ahol az Apple úttörő látástechnológiája létrehozza a szemünk ábrázolását mások számára, így gyakorlatilag önmagunk digitalizált változatát mutatjuk be, miközben személyesen interakcióba lépünk másokkal. A valóságnak ez a digitalizálása, mely virtuálisan lehetővé teszi a távoli és személyes interakciókat, elmossa a fizikai és a digitális világ közötti határokat. Bár hátborzongató és egy Black Mirror-epizódra emlékeztet, ez kétségtelenül úttörő és újszerű megközelítése a kevert valóságoknak.
Peremintelligencia: adatvédelem és decentralizáció
A Vision Pro digitális valóság képességeivel a magánélet védelmével kapcsolatos aggodalmak válnak újra kiemelkedő jelentőségűvé. Az Apple azonban azzal különbözteti meg magát versenytársaitól, hogy a gépi tanulás és a mélytanulás révén végrehajtott intelligencia helyben, az eszközön történik. Ez a megközelítés védi az érzékeny adatokat, például a szemmozgás követési információkat, az esetleges visszaélésekkel szemben, és megőrzi a felhasználó magánéletét is. Azáltal, hogy az intelligenciát az előtérbe helyezi, az Apple biztonságosabb és decentralizáltabb számítástechnikai paradigmát hoz létre, mely összhangban van a decentralizáció és az edge computing mai elveivel. Ez a stratégiai lépés nem csak az Apple-t helyezi új vezető pozícióba az edge computing területén, de a mesterséges intelligencia, az etika, a magánélet és az adatbiztonság körül zajló vitában is jelentős előnyt élvezhet már. A térbeli számítástechnika, a digitális valóság és a peremintelligencia kombinálásával az Apple élesen megkülönbözteti magát így a mai versenytársaitól, és a Vision Pro-t társadalmi, kulturális és technológiai szempontból is korszakalkotó számítástechnikai eszközzé emeli.
Az Apple Vision Pro jelentős előrelépést jelent a számítástechnikában, hasonlóan az iPad és talán még az iPhone átalakító hatásaihoz. A térbeli számítástechnikával, a digitális valósággal és a mesterséges intelligenciával az Apple új keretet és perspektívát vezet be az ICT-világba, forradalmasítva a számítógépekhez, az információhoz, a médiához és a digitális világhoz való viszonyunkat. A Vision Pro ára viszont aggodalomra ad okot, de egyúttal stratégiai lépésként is szolgálhat, mely holisztikusan szemlélve magasra teszi a lécet az iparág számára az értékteremtés tekintetében. A versenytársakat arra készteti, hogy az innováció új szintjére emelkedjenek. Ha elgondolkodunk az iPad digitális kultúrára gyakorolt átalakító hatásán, akkor láthatjuk, hogy a Vision Pro még mélyrehatóbb és látomásosabb átalakulást hozhat a digitális környezetekbe. Az idő persze majd eldönti, de az Apple talán épp most jelentette meg a következő forradalmi termékét.
Mi is az a vegyes valóság?
Mi az a vegyes valóság kijelző? Mi az MR-élmény? Hogyan kapcsolódik az MR az AR-hez vagy a VR-hez? A virtuális valóság az egyik legnépszerűbb feltörekvő technológia, különösen 2014 óta, amikor a Facebook hatalmas összeget fizetett az Oculusért, és a fogyasztói, fejre szerelhető kijelzők (HMD-k) széles választéka vált könnyen elérhetővé. A virtuális valóság (VR) a technológia segítségével egy teljesen számítógép által generált világba meríti az embert, és eltávolítja őt a jól ismert rögvalóságuktól. Ebben különbözik rokonától, a kiterjesztett valóságtól (Augmented Reality, AR), melynek célja, hogy a virtuális képeket zökkenőmentesen jelenítse meg a felhasználó valós világában lévő tereiben és tárgyain. Az elmúlt években azonban egy új kifejezésről, a „vegyes valóságról” vagy MR-ről kezdtek beszélni. A Google Trends szerint mára ötszörösére nőtt a Mixed Realityre vonatkozó keresések száma, és a kifejezés egyre több marketinganyagban jelenik meg. Az egyik gyártó még azt is büszkén állítja, hogy ők gyártják a világ első „Mixed Reality” kijelzőjét, látszólag nem tudván, hogy a Canon már majdnem egy évtizede árul MR-rendszereket. Azonban mint minden marketing által felkapott kifejezés, itt is van némi zavar a tekintetben, hogy mi is valójában a Mixed Reality.
Az MR titkai
A vegyes valóság definíciója 1994-ig, Paul Milgram és Fumio Kishino kutatási tanulmányáig vezethető vissza. Ez volt az első tudományos tanulmány, mely a számítógépes interfészekkel összefüggésben használta a „vegyes valóság” kifejezést. Az azóta eltelt közel 25 év alatt ezt a tanulmányt több mint 2600 alkalommal idézték, így ez a legnépszerűbb kutatási anyag, melyben a kifejezést említették, és többször idézték, mint a legtöbb AR vagy VR témájú kutatási anyagot. Milgram és Kishino a vegyes valóságot úgy definiálja, mint „…a VR-hez kapcsolódó technológiák egy sajátos alosztályát, mely a valós és a virtuális világ összeolvadását foglalja magában”. Pontosabban azt mondják, hogy az MR a valós és virtuális világok keveredését foglalja magában valahol a „valóság-virtualitás kontinuum” (RV) mentén, mely összeköti a teljesen valós környezeteket a teljesen virtuálisakkal. Az RV-kontinuum a teljesen valós és a teljesen virtuális környezetek között mozog, és magában foglalja az AR-t és a kiterjesztett virtualitást (Augmented Virtuality, AV). Az AV egy virtuális világ, melybe a valós világ elemeit vezetik be, hasonlóan ahhoz, ahogyan az AR a valós világot a virtuális képi világ elemeivel egészíti ki. A vegyes valóság a teljesen valós környezet és a teljesen virtuális környezet közötti kontinuum egy részét fedi le. Azonban mindig a valós és a virtuális világ elemeinek összevonásával jár, ezért a kontinuum végpontjai nem tekinthetők vegyes valóságnak. Egyszerűen fogalmazva, a VR-élmény, melyet egy olyan VR-fejre szerelt kijelzőn nézünk, mely nem mutatja a valós világ egy részét, nem MR-élmény. Hasonlóképpen, a valós világ élő videó továbbítása egy TV-képernyőn, mely nem tartalmaz virtuális képeket, szintén nem MR-élmény. Azonban szinte minden olyan kijelző, amely a valós és virtuális képeket kombinálja, vegyes valóság élményt nyújthat.
A vegyes valóság kijelzők típusai
A vegyes valóság fogalmának jobb megértése érdekében Milgram egy későbbi tanulmányában hét MR-kijelzőtípust sorol fel:
Monitor alapú (nem immerzív) videokijelzők: A valós világ videójának megjelenítése, melyre digitális képeket helyeznek fel.
Videót megjelenítő HMD: Ugyanaz, mint az 1. típus, de a tartalom egy HMD-ben van.
Optikai átlátszó HMD: Átlátszó kijelző, mely lehetővé teszi, hogy a virtuális képek a valós világ fölé helyezve jelenjenek meg.
Átlátszó videó HMD: Ugyanaz, mint a 3., de a felhasználó előtt a valós világról készült videót jeleníti meg, melyre virtuális grafikát helyeznek.
Monitoralapú AV-rendszer: 3D-s grafika megjelenítése egy monitoron, melyre videót helyeztek fel.
Immerzív vagy részben immerzív AV: 3D grafika megjelenítése egy immerzív kijelzőn, ráhelyezett videóval.
Részlegesen immerzív AV-rendszerek: Olyan AV-rendszerek, melyek további valós tárgyakkal való interakciót tesznek lehetővé, például interakciót a saját (valós) kezünkkel.
Az Apple Vision Pro megjelenése előtt, a legfejlettebb MR rendszer, a Microsoft HoloLens volt, ami egy optikai-áttekintő kijelző, mely lehetővé teszi a virtuális információk megjelenését a valós világban, és így egy 3. típusú MR-kijelzőnek minősül. Hasonlóképpen, egy nagy képernyő, melyen virtuális karakterek interakcióba lépnek valós emberekkel egy kameraképen, 1-es típusú MR-kijelzőnek is minősül. Amint az ebből a felsorolásból látható, szinte minden olyan kijelző, mely valós időben kombinálja a virtuális és valós képeket, MR-kijelzőnek minősül. Ezek azonban különböző tulajdonságokkal rendelkeznek. Például az 1., 2. és 4. típusok videóalapúak grafikai kiegészítésekkel, míg az 5. típus grafikaalapú videós kiegészítésekkel. Szükség van tehát egy olyan taxonómiára, mely az MR-kijelzőket e tulajdonságok szerint osztályozhatja.
A vegyes valóság taxonómia árnyékában
Milgram és Kishino tanulmányukban három dimenziót írnak le, melyek segítségével osztályozhatók az MR-élmények: a világ ismeretének mértéke, a reprodukció hűsége és a jelenlét-metafora mértéke.
A világismeret kiterjedése (EWK): A világismeret kiterjedése a valós világnak az MR-rendszer által modellezett és megértett mennyisége. Ez attól kezdve, hogy a rendszer semmit sem tud a valós világról (World Unmodelled), egészen addig terjed, hogy a rendszer a világ teljes modelljével rendelkezik. Ez is egy kontinuumon rendezhető, a HoloLens például letapogatja a valós világot, és geometriai modellt hoz létre róla, így ennek a kontinuumnak a jobb vége felé helyezkedik el. Más MR-rendszerek azonban számítógépes látást használnak egy vizuális jelölőből történő követésre, és így semmit sem tudnak a valós világról azon kívül, hogy hol van a jelölő, ezért a kontinuum bal oldala felé kell helyezkedniük.
Reprodukcióhűség (RF): A reprodukcióhűség arra vonatkozik, hogy mennyire valósághű a valós világ megjelenítése, vagy a számítógépes grafikai megjelenítés minősége. A világ megörökítése szempontjából tehát a kontinuum egyik végén a monoszkópos videó, a másik végén pedig a nagy felbontású 3D videó található. Hasonlóképpen, a grafika tekintetében az egyik végén egyszerű drótvázak, míg a másik végén valós idejű, fotorealisztikus, nagy hűségű grafikák találhatók. Például a Canon MREAL MR kijelző sztereó videokamerákkal rendelkezik a valós világ rögzítéséhez, és így e kontinuum közepén helyezkedik el, míg az egy kamerával rendelkező kézi kijelzők inkább a bal oldalon helyezkednek el.
A jelenlét metaforája (EPM): Az EPM dimenzió arra vonatkozik, hogy a felhasználó mennyire érzi magát elmerülve vagy jelenlévőnek a megjelenített jelenetben. A HMD-k tehát nagy fokú jelenlétérzetet biztosítanak, míg egy MR-jelenet asztali monitoron történő megtekintése alacsonyabb szintű jelenlétérzetet biztosít. Az én-központú kijelzők, mint például a 2. és 3. típusú kijelzők általában nagyobb jelenlétérzetet biztosítanak, mint az exocentrikus 1. típusú kijelzők.
A fenti három dimenzió nagyrészt független egymástól, így az alábbiakban bemutatott módon egy osztályozási tér tengelyeiként használhatók. Ez a taxonómiai tér használható a rendelkezésre álló MR-kijelzők megkülönböztetésére. Például a HoloLens rendkívül jó világismerettel (EWK), jó reprodukcióhűséggel (RF) és átlagon felüli jelenlét érzékeléssel (EPM) rendelkezik. Ezzel szemben a virtuális grafikát a nyomon követett jelölők felett megjelenítő mobiltelefon nagyon alacsony EWK-val, közepes RF-vel és kis EPM-mel rendelkezett. Ebből világosan látszik, hogy bár a HoloLens és a mobiltelefon egyaránt MR-kijelző, a HoloLens sokkal jobb MR-élményt nyújt. Hogy az Apple Vision Pro mennyiben fogja ezt a helyzetet megváltoztatni az a jövő és az ICT iparági korifeusok kezében van még jelenleg.