Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Fordítóhiány: gépi fordítás a határon

MEGOSZTÁS

Az amerikai-mexikói határon szakemberhiány miatt egyre gyakrabban használt gépifordítás-rendszerek hibái emberi sorsokat változtathatnak meg drasztikusan. Ideje lenne valamit tenni ellene.

Képek: Wikimedia Commons, Chris Woodford

 

A gépi fordítás hibái végzetes következményekkel lehetnek menedékjog-kérvényezőkre, kérelmük pozitív vagy negatív elbírálása, védelem vagy kiutasítás múlhat rajtuk. Az Egyesült Államokban és máshol is egyre kevesebb a húsvér fordító, és emberhiányban a bevándorlási hivatal mind gyakrabban használ mesterséges intelligenciát (MI) az anyagok megítéléséhez nélkülözhetetlen fordításhoz. A rossz gépi fordítások hiteltelenné teszik a technológiát.

A Belbiztonsági Minisztérium megígérte, hogy biztosít humán tolmácsokat az angolul nem vagy alig beszélő menedékjog-kérelmezőknek, a valóságban azonban nincs mindig van így, mert ember hiányában/helyett gyakran kell gépi fordítást használniuk.

 

Nem mindegy, hogy egyes vagy többes szám első személy

Az amerikai bevándorlásügyi hatóságok változatos modelleket használnak. A minisztérium a Lionbridge-el és a TransPerfecttel, a bevándorlási hivatal a Google fordítóval, a vám- és határőrség a Google Cloudban lévő fordításokat használó, saját fejlesztésű CBP appal dolgozik.

Több elutasított kérelemből kiderült, hogy a válasz apró hibák miatt lett negatív. Például a modellek az egyes szám első személyt gyakran fordítják az angol „we”-re (mi), mire a hatóságok azt gondolhatják, hogy a kérelmet többen írták, ami teljesen illegális. Egy másik alkalommal egy nő kérvényét azért bírálták el negatívan, mert a fordító az erőszakoskodó apát „főnökként” (boss) ültette át angolra.

 

 

Egyes fordításoknak se füle, se farka. Egy analfabéta, portugálul beszélő brazilt azért szakítottak el a családjától, és tartották őrizetben, mert a modell teljesen melléfordítva, halandzsaként jelenítette meg a kérvényt.

 

A gépi fordítás outputját különféle tényezők befolyásolhatják

A legtöbb széles körben beszélt nyelvhez nincs elég gyakorlóadat. Szuahéliül például közel 80 millióan beszélnek, és mégis kb. ugyanannyi online cikk található a neten a kelet-afrikai nyelven, min t amennyi a 250 ezernél kevesebb személy által beszélt (nyugat-franciaországi) bretonul.

Gyakori hibaforrás, hogy sok modell az angolt használja közvetítőként, ha mondjuk, bengáliból zulura kell átültetni valamit. Vagy például angolul csak egy szó van a rizsre, míg a szuahéli és a japán is különbséget tesz a főtt és a nyers rizs között. Ha pedig a két nyelv közé ékelődik az angol, az MI nem tud mihez kezdeni az eltérésekkel, marad a „rizs.”

Modelleket sokszor egy nyelv hivatalos változatán gyakoroltatnak, és nem vagy alig ismerik a köznyelvet. Vagy a leggyakoribb dialektust ismerik csak jól, és többször hibáznak, ha kevésbé ismerttel szembesülnek.

Az audióminták hiánya szintén komoly probléma, mert a modellnek így fogalma sincs a beszélő kiejtéséről, hanghordozásáról, hangmagasságáról stb.

Megoldás lehet, ha több befektetéssel támogatják a gépi fordítást, a határmenti munkafolyamatokat, embert is tartalmazó (human-in-the-loop) rendszerek fejlesztését.

PODCAST

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek