Képek: Wikimedia Commons, Duke Egyetem
A Duke Egyetem kutatói személyek agyi jelzéseit szavakká fordító agy-számítógép interfészt (brain-computer interface, BCI) használó beszédprotézist fejlesztettek. Az eszköz 256 agyérzékelőt tartalmaz, a szenzorokat orvosi minőségű, postai bélyegző méretű, rugalmas műanyagdarabra szerelték fel.
Halandzsa szövegekből is sokat ért a rendszer
Más jellegű (Parkinson kór, rosszindulatú tumor miatti) agysebészeten átesett négy személynek ideiglenes beültették, majd nonszensz szavak sorozatának hangos mondogatására kérték őket. A szavakat („ava”, „kog” stb.) meg kellett hallgatniuk, majd el kellett ismételniük.
A neurális és beszéd-adatokat gépitanulás-algoritmuson futtatták le, hogy megállapítsák, pontosan előrejelezhetők-e a kizárólag az agytevékenységről készült felvételek alapján.
Egyes hangokat, például a „gak” g-jét 84 százalékban azonosította, mert vele kezdődött az általában három hangból álló szó. A rendszer pontossága visszaesett, amikor szóközépi vagy végi, esetleg egymáshoz hasonló hangokat (p és b stb.) kellett felismernie.
Az eszköz összességében negyven százalék pontossággal dolgozott. A kutatók szerint sokat segíthet neurológiai okok miatt beszédképtelen személyeken, akik a BCI közreműködésével visszanyerhetik beszéd-, és kommunikációs készségüket. A számmal azért elégedettek, mert a hasonló agy-beszéd technológiákhoz több idő és adat kell. Ők viszont kilencven másodperces beszélt szövegeket használtak a tizenöt perces tesztből.
Miért jobb a hasonló technológiáknál?
Sokan szenvednek a beszédkészséget csökkentő motorikus rendellenességektől, mint az ALS (amiotrófiás laterális szklerózis, a legismertebb beteg Stephen Hawking volt) vagy más szindrómák. A kommunikációt számukra biztosító mostani szerkezetek viszont általában lassúak és nehézkesek.
Ezek a neuroprotézisek átlagosan percenként 78 szót dekódolnak, míg egy ember általában 150 szót mond ki ugyanennyi idő alatt. Az elmondott és a dekódolt beszéd közötti késés az agytevékenységet figyelő szenzorok relatíve alacsony számával magyarázható. Viszonylag kevés olvasztható rá egy, az agy felszínére helyezett, papírvékony anyagra. Kevesebb érzékelő kevesebb dekódolható információt szolgáltat.
A Duke Egyetem szakemberei mindenképpen javítani akartak a teljesítményen. Összeálltak egy nagyon sűrű, ultravékony és rugalmas agyi érzékelőket fejlesztő agykutatóval, ő dolgozta ki a 256 szenzoros megoldást.
Az idegsejtek aktivitási mintázata jelentősen eltérhet beszéd koordinálása közben, ezért a tervezett beszéd pontos előrejelzéséhez meg kell különböztetni a szomszédos agysejtektől érkező jeleket.