Kiemelt kép: Flickr
A mai mesterségesintelligencia-rendszereknek egyik leggyakrabban felrótt hibája, hogy elfogultak. Ez a rossz tulajdonságuk az általuk megfigyelt, tanulásukhoz használt adatoknak tudható be. Elfogult adatokra hagyatkozva, elfogult döntéseket hozhatnak.
Viszont, ha a gyakorlóadatokat megtisztítjuk, kigyomláljuk közülük a nem korrekteket, csökkenthetők a gépitanulás-algoritmusok megkérdőjelezhető döntései. Erre tettek kísérletet a Viterbi Dél-kaliforniai Egyetem (USC Viterbi) kutatói.
Az egyesített tanulás előnyei és hátrányai
Problémát okoz, hogy a forrásadat hozzáférhetősége gyakran nem biztosított. Az egyik népszerű gépitanulás-technika, az egyesített tanulás esetében különösen nem, mert az algoritmusok gyakoroltatása több decentralizált adatsorral, helyi adatminták cseréje nélkül történik. Mivel nem kell közvetlen hozzáférés az adatokhoz, a technikával megoldható a magánszféra (privacy) védelme, kényes, például pénzügyi vagy egészségügyi információk nem szivároghatnak ki.
Globális és lokális mesterségesintelligencia-modellek (Wikimedia Commons)
Egyesített tanulással kutatók együttműködésével, a privacy megőrzésével gyakoroltathatók modellek. A pozitívum mellett, a technikának azonban van negatívuma is: növelheti az egyes, például demográfiai csoportokkal szembeni elfogultságot. Az ok egyszerű: hogy ne így legyen, ahhoz az összes adatpontnál központi hozzáférés kellene a kényes infókhoz.
Az egyesített tanulás és általában a gépi tanulás térhódításával mesterséges intelligenciák egyre több, privát adatot felhasználó döntést hoznak, és ezek a döntések emberi sorsokat befolyásolhatnak. Az USC Viterbi kutatói a korrekt döntéshozásra törekedve, fejlesztették egyesített tanuláson alapuló FairFed rendszerüket.
Hogyan hozzon korrekt döntést egy bank mesterséges intelligenciája?
Banki hitelkérvények gépi tanulásos elbírálása volt a példájuk. Ebben az esetben minden entitás (bank) a helyi lakosság adatait használva, kiszedi adatsorából az elfogultakat, majd szintén „helyi korrektség-mérővel” kiszámítja az algoritmus elfogulatlanságát. Ezt követően, hogy az algoritmus még objektívebb legyen, a globális modellt másokkal együttműködve, alkalmazza a lokális infókra, amellyel tovább növeli a modell összesített „súlyát.”, azaz korrektebb lesz. Ügyfelekre alkalmazva, FairFed a globális mércét elérő helyieket részesíti előnyben. Bankoknál pedig minél közelebb áll egy pénzügyi szolgáltató a globális normához, annál elfogulatlanabb.
Részrehajlás, elfogultság (Intellectual Freedom Blog)
FairFedet szerteágazó forrásokból származó, változatos formájú és méretű, heterogén adatokkal, tehát tényleges valóvilág-forgatókönyvekben értékelték ki. Viszonyítási alapként: általában mi, emberek is ilyen adatok alapján hozunk döntéseket.
A rendszer jobban teljesített, mint a szintén egyesített tanulással trenírozott legfejlettebb algoritmusok. Erősen heterogén infókat használva, változatos demográfiai csoportok esetében mindig korrekt döntéseket hozott, és tette mindezt úgy, hogy személyes adatokhoz nem fért hozzá.