A Marylandi Egyetem (UMD) és a Microsoft közös tanulmányában összesen 26 nyelvet vizsgáltak meg a mesterséges intelligencia (MI) modellek “ösztönzése”, vagyis promptolása terén.
Hiába a technológia nyelve az angol
A 26 vizsgált nyelv közül a lengyel bizonyult a leghatékonyabbnak, miközben az angol csak a hatodik helyet érte el.
„Kísérletünk néhány meglepő és nem intuitív eredményt hozott. Először is: az angol nem teljesített a legjobban minden modellnél – sőt, amikor hosszabb szövegeket vizsgáltunk, a 26 nyelv közül csupán a hatodik helyre került, míg a lengyel lett a vezető nyelv” – írták a tanulmány szerzői.
Több LLM-et is teszteltek
A kutatócsoport több nagy nyelvi MI-modellt, köztük az OpenAI, a Google Gemini, a Qwen, a Llama és a DeepSeek rendszereit is tesztelte. A kutatók arra voltak kiváncsiak, mennyire jól reagálnak ugyanarra a bemenetre 26 különböző nyelven.
Az eredmények szerint a lengyel átlagosan 88 százalékos pontossággal teljesítette a feladatokat – számolt be a kutatás eredményeiről a Euronews.
Az elemzés alapján ez a legpontosabb nyelv, ha mesterséges intelligenciának adunk utasításokat.
Eddig a lengyelt széles körben az egyik legnehezebben tanulható nyelvnek tartották. Mint kiderült, az embereknek ez valóban gondot okoz – de az MI-nek nem – írta a Lengyel Szabadalmi Hivatal egy Facebook-bejegyzésben.
Az MI-nek meg se kottyan
Érdekesség, hogy az MI-rendszerek rendkívül jól értették a lengyel nyelvet, noha a lengyel nyelvű tanítóadatok mennyisége jóval kisebb, mint az angolé vagy a kínaié.
Összehasonlításképp: a kínai nyelv kifejezetten gyengén teljesített, a vizsgált 26 nyelv közül a negyedik legrosszabb helyre került.
A beszélgető MI számára leginkább “hatékony” nyelvek top tizes listája a következő lett:
- Lengyel – 88 százalék
- Francia – 87 százalék
- Olasz – 86 százalék
- Spanyol – 85 százalék
- Orosz – 84 százalék
- Angol – 83,9 százalék
- Ukrán – 83,5 százalék
- Portugál – 82 százalék
- Német – 81 százalék
- Holland – 80 százalék
(Kép: Unsplash/Note Thanun)