Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Hogyan csalnak a képgenerátor mesterséges intelligenciák?

MEGOSZTÁS

Nem árt az óvatosság, ha valamelyik népszerű képgeneráló alkalmazással dolgozunk, mert előfordulhat, hogy egy az egyben lemásolja az egyik képet, amelyen gyakorolt.

Nyitókép: Trusted Reviews

 

A szöveges utasítások, promptok alapján képeket generáló alkalmazások a mesterségesintelligencia-robbanás legnépszerűbb termékei közé tartoznak. A modellek azonban nemcsak az ember-gép együttműködés szép példái, mert azon kívül, hogy besegítenek a művészi munkába, vagy egyszerűen élményt okoznak, súlyosabb kérdéseket is felvetnek: megsértik-e a szerzői jogokat műalkotások engedély nélküli, gyakorlóadatként történő használatuk?

Ha a képgenerátor szinte vagy teljes egészében lemásolja az eredetit, akkor egyértelmű a válasz: jogsértés történt. Előfordul, hogy az utasítások alapján nem „önálló” anyaggal áll elő, hanem valamelyik gyakorlóképpel, amiről a felhasználó általában mit sem tud. Amerikai bíróságokon több per folyik már emiatt. Hasonlóságok esetén viszont nem minden ennyire fekete-fehér, a mérték számít.

 

De milyen gyakran utánoz az MI?

A Maryland Egyetem kutatói a másolás kimutatására dolgoztak ki módszert, technikájukkal teljes képektől a háttérben lévő tárgyakig, minimális változtatásokig, majdnem minden gépi turpisság kiderül.

 

A Stable Diffusion által generált portré (Kép: Wikimedia Commons)

 

Képek közötti hasonlóság kiderítésének elterjedt módja, hogy beágyazásokat készítenek róluk, majd kiszámítják a pontok közötti egyezéseket. Ha a szám magas, hasonlóságról beszélhetünk. Az eljárás hátulütője, hogy főként nagyléptékű azonosságokra derít fényt, a kisebbekre, a „lokális” részletekre már nem.

A beágyazások szétválasztása, a pontok kiszámítása, magasabb értékek keresése lehet ilyenkor a megoldás. A marylandi kutatók is ezt alkalmazták: képgenerátorokat gyakoroltattak, amelyek képeket generáltak, majd azokhoz és a gyakorlósorhoz is beágyazásokat készítettek. Ezt követően a beágyazásokat darabokra szedték, és a generált a gyakorlóképek beágyazásait összehasonlítva, mutatták ki a másolatokat.

 

Még a Stable Diffusion is másol

Első lépésben a másolás azonosításában eredményes beágyazások modelljeit tanulmányozták. Tíz begyakoroltatott gépilátás-architektúrát öt képfeldolgozásra használt és öt más szintetikus adatsoron teszteltek, és kiválasztották az első hármat (közös bennük, hogy előzetesen mindhárom az ImageNeten gyakorolt).

 

A Stable Diffusion által generált városkép (Kép: Wikimedia Commons)

 

A képgeneráláshoz virágok és arcok adatsoraiból készült képeken modellt gyakoroltattak kisebb (száz-háromszáz), közepes (ezer-háromezer) és nagyobb (nyolcezernél több példát tartalmazó) részhalmazokon.

Az első lépés végén kiválasztott modellek a gyakorlósorhoz és a generált képekhez is elkészítették a beágyazásokat, amelyeket a kutatók arányosan, kisebb részekre szedtek. A hasonlóságokat, egyezéseket a részletpárok pontszámai alapján állapították meg.

A kutatók ezt követően hasonló kísérleteket végeztek begyakoroltatott Stable Diffusion modellel is. Azért a Stable Diffusion-nel, mert azt széles körben alkalmazzák. Kiderült, hogy a modell által generált képek 1,88 százaléka másolatnak tekinthető (0 és 1 közötti hasonlóság-pontszámuk több volt a 0,5-ös határértéknél).

PODCAST

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek