Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Újabb emberi tulajdonsággal bővül és javul a gépi látás

MEGOSZTÁS

Hiába javul a gépi látás, meg sem közelíti az emberi szem komplexitását. Egy új kutatással az MI ezen a területen is valamivel közelebb kerül hozzánk.

A nyelvtechnológiák mellett a gépi látás a szemünk előtt zajló mesterségesintelligencia-forradalom motorja. A terület az elmúlt tíz évben nagyon gyorsan fejlődött, de ennek ellenére még távol áll az ember kifinomult vizuális érzékelésétől.

Kutatóközpontokban, laborokban a gépszemek javítása sok kísérlet tárgya. A Massachusetts Institute of Technology (MIT) mindig az MI-fejlesztés egyik élharcosának számított, az intézményben olyan legendák dolgoztak, mint John McCarthy, Marvin Minsky vagy Rodney Brooks. Ma sincs másként, ezért nem meglepő, hogy a gépi látást is intenzíven tanulmányozzák, és próbálják közelíteni az emberéhez. Jelenleg az egyik jellegzetesen humán tulajdonsággal próbálják felruházni az MI-t.

Hogyan látjuk mi és egy MI a mellettünk elsétáló macskát?

Képzeljük el, hogy egy parki padon ülünk, és elhalad előttünk egy macska. A jelenet ugyan folyamatosan változik, az emberi agy viszont időben stabil reprezentációvá alakítja át a vizuális információkat. Ez a képességünk, az „észlelési kiegyenesedés” segít a cica útirányának előrejelzésében.

A gépilátás-modellek egyelőre nem rendelkeznek ilyen adottságokkal, így a képi infókat másként, kaotikusabban reprezentáljál, következtetni is nehezebb belőlük. Ha azonban elsajátítják, akkor sokkal pontosabban felbecsülhetik élőlények és tárgyak mozgását.

MIT-s kutatók rájöttek, hogy speciális gyakorlómódszerrel, sokmillió példa alapján gépilátás-modellek többet megtanulnak az észlelési kiegyenesedésről, hogyan alkalmazzák feladatok végrehajtásakor. A technika neve ellenséges tréning, amellyel a gépszem kevésbé reagál a képekhez adott apró hibákra, és így az észlelése is javul.

Biztonságosabbak lesznek az önvezető autók

Ha a modell reprezentációja előrelátható módon változik, miközben megy a videó, fokozatosan „kiegyenesedik”, és a kimenő információ jobb lesz, mint volt a bejövő. Sok modellt tesztelve jutottak el eddig, legeredményesebbnek toronymagasan az ellenséges tréningnek alávetettek bizonyultak. Gyakoroltatásuk közben a képeket minden egyes pixel apró módosításával változtatták meg. Az ilyen módosítások teljesen megzavarják a „mezei” gépszemeket, ellenséges tréningen áteső modellek viszont robusztusabbak, nem verhetők át.

Az is kiderült, hogy az észlelési kiegyenesedést a feladat is befolyásolja, amelyre a modellt begyakoroltatják. Az absztrakt feladatokra, például képosztályozásra kiképzettekben jobban kialakul, mint a konkrétabb célokra, mondjuk, képpixelek kategóriákhoz rendelésére betanítottakban.

A kutatók bizakodnak, hogy az észlelési kiegyenesedés jobb megértésével a modellek még robusztusabbak és pontosabbak lesznek. Ha sikerrel járnak, például biztonságosabbá válnak az önvezető autók, mert sokkal pontosabban előre tudják jelezni biciklisek, gyalogosok stb. útirányát.

Újabb gyakorlómódszereken is dolgoznak, és az ellenséges tréningen is javítani akarnak. A módszer eredményessége azért meglepő, mert az ember nem így érzékeli a világot, és mégis segít abban, hogy az MI emberszerűbben viselkedjen.

IT EXPERTS-TECH LEADERS 2024 FELHŐ A JAVÁBÓL KONFERENCIA

PODCAST

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek

ICT Global News

Iratkozz fel a hírlevelünkre, hogy ne maradj le az IT legfontosabb híreiről!