Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Los Angeles, 3028 – ahogy a mesterséges intelligencia látja

MEGOSZTÁS

Egy los angelesi filmes eleresztette mesterséges intelligenciája fantáziáját, és a modellnek a 3028-as Los Angelesi Olimpiai Játékokról kellett videót készítenie. A bő egyperces anyag részletei látványosak, ugyanakkor tökéletesen illusztrálja, hogy miben nem jó még az MI. Ez a Los Angeles pedig minden, csak nem 3028.

Néhány hete ért véget a párizsi olimpia, most folynak a paralimpiai játékok, a 2028-as Los Angelesi messzinek tűnik, de a sportközegben dolgozó, ottani illetőségű Josh Kahn filmrendező még előrébb tekintett: milyen lesz a 3028-as Los Angelesi rendezvény? – kérdezte MI-jétől.

Tökéletes feladat egy mesterséges intelligenciának, ilyenekre nagyon szeretjük használni őket, a kép- és mozgókép-generátorok, például az OpenAI Sora rendszere, a Runway, a Synthesia vagy kínai versenytárs-kollégáik, a Kling és a MiniMax egyre jobbak, videóik élethűbbek, fotorealisztikusak. A szöveges ChatGPT, a szöveges promptokból képeket varázsló Midjourney, DALL-E, Stable Diffusion és társaikat követően, ezek az alkalmazások is mainstreammé válnak.

Gyorsak és csökken az áruk, percek alatt elkészítenek korrekt, HD-minőségű anyagokat. Hagyományos módszerekkel, például a CGI-vel (számítógéppel generált képek) és az animációval összehasonlítva, kevesebb a technikai probléma. Nem tökéletes az összes képkocka – emberek kezén öt helyett nem egyszer látunk hat vagy hét ujjat, tárgyak hipp-hopp, indokolatlanul eltűnnek és hasonlók –, de ezekkel együtt kereskedelmi alkalmazásokra különösen jók. Több területen élnek is velük: hirdetésügynökségek, kisebb filmesek, változatos szektorokban működő vállalatok, mezei tartalomgyártók, lényegében bárki, aki gyorsan és olcsón akar nem feltétlenül hollywoodi minőségű videót készíteni.

Csak ilyen lesz 3028-ban Los Angeles?

Kahn jó ideje használ mesterséges intelligenciát videókhoz. Ezúttal a Runway legújabb változatával dolgozott, és a jövő olimpiájáról promptolta. Minden egyes jelenethez, jelenetrészlethez más szöveges utasítást adott neki. A végeredmény nem hosszú, alig több egy percnél, és a látványos mozgókép-orgia ellenére hagy kívánnivalót maga után. Légi felvételeket látunk a jövő Los Angeleséről, futurisztikus képsorokat jól érzékelhetően megemelkedett óceánszintről, több a víz, mint ma, de a város még ugyanúgy áll, nem öntötte el semmi, a felhőkarcoló-rengeteg változatlan, egyikük tetején a meccseknek és más rendezvényeknek otthont adó monumentális focipálya díszeleg, de láthatunk több más sportág rendezvényeire alkalmas dómszerű, gömb-forma stb. csoda-létesítményeket is.

 

Itt rendezik majd az úszóversenyeket

 

A videó sajnos nem a város potenciális fejlődését ábrázolja, hanem inkább bemutatóanyag: erre képes a mesterséges intelligencia, első ránézésre hibátlan minden, tökéletes a látvány.

„Néztük az olimpiát, és azt hogy a rendező város milyen nagy gondot fordít a kulturális történetmesélésre. Los Angeles a képzelet és a történetmesélés kultúrája, Hollywood adja meg az alaphangot a világ többi részének. Nem lenne jó, ha bemutathatnánk, hogyan nézne ki az olimpia, ha ezer év múlva visszatérne Los Angelesbe?” – vetette fel az egyértelmű kérdést Kahn.

Igen, jó lenne, de a videón egész biztosan nem 3028-at látjuk. Ugyan futurisztikus, de inkább harminc-negyven év, és nem egy egész millennium múlva képzeljük el ilyennek Los Angelest.

A mesterséges intelligencia gyerekbetegségei

A végeredmény tökéletesen illusztrálja, hogy kreatív személyeknek mekkora áldás lehet a generatív MI. Másrészt, a hátrányait is látjuk. Kahn szűkszavú volt, promptjait nem árulta el, mint ahogy azt sem, hogy jelenetenként, és összességében hányra volt szüksége. Viszont figyelmeztetett, hogy ha minőségi tartalmat akarunk készíteni a technológiával, hozzá kell szoknunk a próba-hiba módszerhez, mert sokat hibázik az MI. Többeket ez eltántoríthat, hiszen gyors végeredményt és nem végtelenbe vesző promptolást akarnak. A jelenlegi sikerarány: jó ha húszból egy összejön, de az ötven-száz próbálkozás sem ritka, sőt…

 

Aréna a város felett

 

Mivel a jövőről volt szó, különösen zavarta, hogy a modell szinte csak az építészetre összpontosított. Abban egyébként tényleg tökéletes munkát végzett, bár a stadion sem 3028, de távolabbi jövő, mint a simán mainak elmenő felhőkarcolók. A tengerszint-emelkedésről pedig nyilván irdatlan mennyiségű tanulóadata volt. Víz felett lebegő sportlétesítményt viszont aligha látott sokat, gyakorlóadataiban sem hemzseghettek az ilyen példák.

A folyamatosság hiánya szintén probléma, túl sok lehetett a prompt. Filmekben külön személyeket alkalmaznak rá, ezért cseppet sem meglepő, hogy a színek, a kamera-beállítások, a nap állása, az épületek formája nem konzisztens. Tipikus mozgókép-generátor MI hiba. Közelképek sincsenek, mondjuk személyekről, pedig nyilván mindenkit érdekelne, hogyan néznek ki, öltöznek kései utódaink. Egyébként ez is tipikus MI-hiba.

Makrokozmosz mikrokozmosz helyett

A technológia nagyléptékű, panoramikus jeleneteknél mindig jobb, mintha a mikrovilágokra, nüánszokra kell fókuszálnia. Hollywood korai filmes MI-alkalmazásai az előbbi területen várhatók: tájakat és tömegeket mutathatnak meg, részletezés nélkül. Pont ezért jó minőségű párbeszédeket se várjunk még tőlük, amikor a kamerának finom rezdüléseket, alig észrevehető változásokat kell megragadnia.

 

Vízilabda 3028

 

Mindezek ellenére, mozgókép-generátorok különösen a hirdetőiparban egyre több célra jók Kínában például óriási a kereslet. És hiába kell temérdek prompt, a gyártás még mindig összehasonlíthatatlanabbul olcsóbb, mintha valódi emberekkel, színészekkel, kamerákkal stb. készülnének az anyagok.

Csak ne arra legyünk kíváncsiak, hogy milyen lesz a 3028-as olimpia Los Angelesben.

 

Képek: MIT

IT EXPERTS-TECH LEADERS 2024 FELHŐ A JAVÁBÓL KONFERENCIA

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek

ICT Global News

Iratkozz fel a hírlevelünkre, hogy ne maradj le az IT legfontosabb híreiről!