Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Fognak egyszer a gépek emberi nyelven beszélni?

MEGOSZTÁS

Ahogy az emberek a beszélgető mesterséges intelligencia rendszerekkel interakcióba lépnek az egyértelmű kommunikáció kulcsfontosságú tényező ahhoz, hogy a kívánt eredményt elérjük. Tágabb értelemben milyen nyelvet használjunk a vezérlőrendszer és a gépekkel folytatott beszélgetések során? Érdemes megvizsgálni az emberek és a mesterséges intelligenciák közötti mély, értelmes kommunikáció felé vezető út jelenlegi állását.

A nyelv álruhába öltözteti a gondolatot. Mégpedig úgy, hogy az ember nem következtethet az öltözet külső formájából a felöltöztetett gondolat formájára, mert az öltözet külső formája egyáltalán nem abból a célból készült, hogy a test formájának megismerését lehetővé tegye.

(Ludwig Wittgenstein)

Fognak egyszer a gépek emberi nyelven beszélni?
A ChatGPT bevezetése jelentős előrelépést jelentett a gépek társalgási képességeiben, és lehetővé tette, hogy akár középiskolások is cseveghessenek nagy teljesítményű mesterséges intelligenciával, és lenyűgöző eredményeket érjenek el. Ez jelentős mérföldkő. Ugyanakkor azt is fel kell mérnünk, hogy hol tartunk az ember-gép kommunikáció útján, és mi szükséges még ahhoz, hogy értelmes beszélgetéseket folytassunk az MI-val (Fotó: Unsplash+)

A gépek kategorikus ugrást tettek a prompt mérnöki tevékenységtől az „emberi beszédig, azonban az intelligencia egyéb aspektusai még felfedezésre várnak. Egészen a közelmúltig, 2022-ig, ahhoz, hogy egy mesterséges intelligencia megfelelően válaszoljon és kihasználja erősségeit, olyan speciális tudásra volt szükség, mint a kifinomult prompt engineering. A ChatGPT bevezetése jelentős előrelépést jelentett a gépek társalgási képességeiben, és lehetővé tette, hogy akár középiskolások is cseveghessenek nagy teljesítményű mesterséges intelligenciával, és lenyűgöző eredményeket érjenek el. Ez jelentős mérföldkő. Ugyanakkor azt is fel kell mérnünk, hogy hol tartunk az ember-gép kommunikáció útján, és mi szükséges még ahhoz, hogy értelmes beszélgetéseket folytassunk az MI-val. Az emberek és gépek közötti interakciónak két átfogó célja van: Utasítani a gépet a szükséges feladatokra, másodszor pedig információt és útmutatást cserélni a feladatok végrehajtása során. Az első célt hagyományosan programozással valósítják meg, de ez mostanra odáig fejlődött, hogy a felhasználóval folytatott párbeszéd egy új feladatot is meghatározhat, például arra kérhetjük a mesterséges intelligenciát, hogy hozzon létre egy Python szkriptet egy feladat elvégzéséhez. A feladaton belüli cserét természetes nyelvi feldolgozással (NLP) vagy természetes nyelvi megértéssel (NLU) kezelték, melyhez gépi válaszok generálása társult. Tegyük fel, hogy az ember-gép interakció fejlődésének központi jellemzője (ha nem is a végpontja) az, amikor az emberek ugyanúgy tudnak kommunikálni a gépekkel, mint egy régi barátjukkal, beleértve az összes olyan szabad formájú szintaktikai, szemantikai, metaforikus és kulturális szempontot, melyet egy ilyen interakció feltételez. Mit kell létrehozni ahhoz, hogy a mesterséges intelligencia rendszerek teljes mértékben részt vehessenek ebben a természetes kommunikációban? A gépek már tettek egy kategorikus ugrást a prompt mérnöki tevékenységtől az »emberi beszéd« felé, azonban az intelligencia egyéb aspektusai még felfedezésre várnak.

A transzformátor-architektúra újradefiniálja az NLP teljesítményét

A számítástechnika kezdetén az emberek és a gépek csak gépi kódon keresztül kommunikálhattak, ami egy bináris számjegyekből álló alacsony szintű számítógépes nyelv: 0-ból és 1-ből álló karakterláncok, melyek kevéssé hasonlítanak az emberi kommunikációra. Az elmúlt évszázadban fokozatosan elindultunk afelé, hogy a gépekkel való kommunikáció közelebb kerüljön az emberi nyelvhez. Ma már az a tény, hogy meg tudjuk mondani a gépeknek, hogy generáljanak egy „sakkozó macskát” ábrázoló képet nagy előrelépésről tanúskodik. Ez a kommunikáció fokozatosan javult a programozási nyelvek fejlődésével az alacsony szintű kódtól a magas szintű algoritmusokig, az alacsony szintű programozási nyelvektől (assembler) a C-n át a Pythonig, valamint az emberi beszédhez hasonló konstrukciók, például az „if-then” utasítás bevezetésével. Most az utolsó lépés a prompt engineering vagy más, a bemeneti megfogalmazás finomságaira való érzékenység kiküszöbölése, hogy a gépek és az emberek természetes módon léphessenek kapcsolatba egymással. Az ember és gép közötti párbeszédnek lehetővé kell tennie az inkrementális hivatkozásokat a beszélgetés folytatására egy korábbi „mentési pontról”.

Az NLP a számítógépek és az emberi nyelvek közötti kölcsönhatásokkal foglalkozik, hogy nagy mennyiségű természetes nyelvi adatot dolgozzon fel és elemezzen, míg az NLU a felhasználó szándékának felismerésére vállalkozik. Az olyan virtuális asszisztensek, mint az Alexa és a Google, az NLP-t, az NLU-t és a gépi tanulást (ML) használják arra, hogy működésük során új ismereteket szerezzenek. A prediktív intelligencia és az analitika segítségével a mesterséges intelligencia képes személyre szabni a beszélgetéseket és válaszokat a felhasználó preferenciái alapján. Bár a virtuális asszisztensek úgy tartózkodnak az emberek otthonában, mint egy megbízható barát, jelenleg az alapvető „parancsnyelvi tautológiára” korlátozódnak. Az emberek alkalmazkodtak ehhez azzal, hogy a legjobb eredmények elérése érdekében „kulcsszavas nyelven” beszélnek, de a társalgási MI még mindig lemarad a természetes nyelvi interakciók megértésében. Amikor kommunikációs zavar támad a virtuális asszisztensükkel, az emberek olyan javítási stratégiákat alkalmaznak, mint a mondatok egyszerűsítése, a rendszernek adott információk mennyiségének variálása, a lekérdezések szemantikai és szintaktikai kiigazítása, valamint a parancsok ismétlése.

Fognak egyszer a gépek emberi nyelven beszélni?
A számítástechnika kezdetén az emberek és a gépek csak gépi kódon keresztül kommunikálhattak, ami egy bináris számjegyekből álló alacsony szintű számítógépes nyelv: 0-ból és 1-ből álló karakterláncok, melyek kevéssé hasonlítanak az emberi kommunikációra. Az elmúlt évszázadban fokozatosan elindultunk afelé, hogy a gépekkel való kommunikáció közelebb kerüljön az emberi nyelvhez (Fotó: Unsplash+)

Ez az a pont, ahol az NLU kritikus szerepet játszik a szándék megértésében. Az NLU elemzi a szöveget és a beszédet, hogy meghatározza annak jelentését. Az emberi beszéd szemantikai és pragmatikai meghatározásainak adatmodelljét használva az NLU a szándék és az entitások felismerésére összpontosít. A Transzformátor neurális hálózati architektúra 2018-as bevezetése a virtuális asszisztensek NLP-teljesítményének növekedéséhez vezetett. Az ilyen típusú hálózatok önfigyelési mechanizmusokat használnak a bemeneti adatok feldolgozásához, lehetővé téve számukra az emberi nyelv függőségének hatékony megragadását. A Google AI Language kutatói által bevezetett BERT a leggyakoribb NLP-feladatok közül 11-et egyetlen modellben kezel, javítva a hagyományos módszert, mely külön modelleket használ az egyes konkrét feladatokhoz. A BERT a nyelvi reprezentációkat egy általános célú nyelvmegértési modellnek egy nagy szövegkorpuszon, például a Wikipédián való kiképzésével előzetesen betanítja, majd a modellt olyan későbbi NLP-feladatokra alkalmazza, mint a kérdésmegfejtés és a nyelvi következtetés.

A virtuális asszisztenseken túl a ChatGPT-vel elért eredmények szinergiában állnak a Transformátor-modellekkel az NLP teljesítményének növekedésével. A GPT-3 Transzformátor-technológiát 2021-ben mutatták be, de a népszerűség és a használat terén a ChatGPT-vel és az emberhez hasonló társalgási interfészre való képességgel kapcsolatos innovációval ért el jelentős áttörést, melyet az emberi visszajelzésekből való megerősített tanulás (RLHF) alkalmazása tett lehetővé. A ChatGPT lehetővé teszi az LLM-ek számára, hogy feldolgozzák és megértsék a természetes nyelvi bemeneteket, és a lehető legemberibb módon generáljanak kimeneteket.

Két kijelentés akkor mond ellent egymásnak, ha semmi sem közös bennük.”

(Ludwig Wittgenstein)

Fognak egyszer a gépek emberi nyelven beszélni?
prediktív intelligencia és az analitika segítségével a mesterséges intelligencia képes személyre szabni a beszélgetéseket és válaszokat a felhasználó preferenciái alapján. Bár a virtuális asszisztensek úgy tartózkodnak az emberek otthonában, mint egy megbízható barát, jelenleg az alapvető „parancsnyelvi tautológiára” korlátozódnak (Fotó: Unsplash+)

A Nagy Nyelvi Modellek uralják a társalgási MI-t

Az OpenAI 2022 novemberi megjelenése óta a ChatGPT uralja a híreket az esszékhez és tesztekhez való, látszólag jól megírt nyelvi generálásával, valamint az orvosi engedélyek és MBA-vizsgák sikeres letételével. A ChatGPT az amerikai orvosi engedélyezési vizsga (USMLE) mindhárom vizsgáján megfelelt mindenféle képzés vagy megerősítés nélkül. Ez arra a következtetésre késztette a kutatókat, hogy 2a nagy nyelvi modellek potenciálisan segíthetik az orvosi oktatást, és potenciálisan a klinikai döntéshozatalt”. A Pennsylvaniai Egyetem Wharton School professzora a ChatGPT-t egy Operations Management MBA záróvizsgán tesztelte, és négyes-kettes osztályzatot kapott. A ChatGPT jól teljesített az esettanulmányokon alapuló alapvető műveletirányítási és folyamatelemzési kérdésekben, helyes válaszokat és szilárd magyarázatokat adott. Amikor a ChatGPT nem találta meg a megfelelő megoldási módszert a problémához, egy emberi szakértő tippjei segítettek a modellnek kijavítani a választ. Bár ezek az eredmények ígéretesek, a ChatGPT-nek vannak korlátai az emberi szintű beszélgetés elérésében.

A 175 milliárd paraméterrel rendelkező autoregresszív nyelvi modellként a ChatGPT nagy modellmérete segít abban, hogy jól teljesítsen a felhasználói szándék megértésében. A szándékszintek alapján a ChatGPT képes feldolgozni a felhasználók pragmatikus, nyitott érvkészletet és rugalmas struktúrát tartalmazó kéréseit, elemezve, hogy mit akar elérni a szöveges kérés. A ChatGPT képes rendkívül részletes válaszokat és tagolt válaszokat írni, és ezzel a különböző területeken, például az orvostudomány, az üzleti műveletek, a számítógépes programozás és más területeken szerzett ismeretek széleskörűségét és mélységét bizonyítja. A GPT-4 is lenyűgöző erősségeket mutat, például a multimodális képességek hozzáadásával és a fejlett humán teszteken elért pontszámok javításával. A GPT-4 a jelentések szerint a 90 százalékban teljesített az egységes ügyvédi vizsgán (szemben a ChatGPT 10%-ával) és a 99%-ban az USA biológia olimpiáján (szemben a ChatGPT 31 %-ával).

A ChatGPT gépi programozásra is képes, bár csak bizonyos fokig. Több nyelven is képes programokat létrehozni, többek között Python, JavaScript, C++, Java és más nyelveken. A kódot hibák és teljesítményproblémák szempontjából elemezni is tudja. Eddig azonban úgy tűnik, hogy a legjobban egy közös programozó és MI kombináció részeként használható. Miközben az OpenAI modelljei nagy figyelmet kapnak, más modellek is hasonló irányba haladnak, például a Google Brain nyílt forráskódú, 1,6 trillió paraméteres Switch Transformer, mely 2021-ben debütált, vagy a Google Bard, amely a LaMDA (Language Model for Dialogue Applications) technológiát használja a webes keresésre és valós idejű válaszok adására.    Bár az LLM-ek nagy lépéseket tettek az emberekkel folytatott természetes beszélgetések felé, a kulcsfontosságú növekedési területeket még meg kell oldani. Az intelligencia és az emberi szintű kommunikáció következő szintjének eléréséhez a kulcsfontosságú területeken ugrásszerű képességfejlesztésre van szükség: a tudás átstrukturálása, több készség integrálása és a kontextushoz való alkalmazkodás biztosítása.

A filozófiai problémák akkor keletkeznek, ha a nyelv szabadságra megy. S ezeket a problémákat nem új tapasztalatok segítségül hívása révén oldjuk meg, hanem régóta ismert dolgok megfelelő elrendezésével. A filozófia küzdelem értelmünknek a nyelv eszközei által történt megbabonázása ellen. A filozófia: terápia. A filozófus kérdéseket kezel; mint betegségeket.”

(Ludwig Wittgenstein)

Fognak egyszer a gépek emberi nyelven beszélni?
A 175 milliárd paraméterrel rendelkező autoregresszív nyelvi modellként a ChatGPT nagy modellmérete segít abban, hogy jól teljesítsen a felhasználói szándék megértésében. A szándékszintek alapján a ChatGPT képes feldolgozni a felhasználók pragmatikus, nyitott érvkészletet és rugalmas struktúrát tartalmazó kéréseit, elemezve, hogy mit akar elérni a szöveges kérés (Fotó: Unsplash+)

Mi hiányzik az Ember-Gép párbeszédből?

Négy kulcsfontosságú elem hiányzik még ahhoz, hogy a társalgási mesterséges intelligencia a természetes beszélgetések folytatásának következő szintjére lépjen. Az intimitás és a közös cél eléréséhez a gépnek meg kell értenie az ember szimbolikus kommunikációjának jelentését, és megbízható, egyéni válaszokkal kell válaszolnia, amelyek értelmesek az ember számára.

Megbízható válaszok előállítása

A mesterséges intelligencia rendszerek nem hallucinálhatnak! Az episztemológiai problémák befolyásolják azt, ahogyan az MI tudást épít, és különbséget tesz az ismert és ismeretlen információk között. A gép hibázhat, elfogult eredményeket produkálhat, vagy akár hallucinálhat is, amikor olyan dolgokról ad választ, melyeket nem ismer. A ChatGPT-nek nehézséget okoz a forrásmegjelölés és az információ eredetének rögzítése. Hihetőnek hangzó, de helytelen vagy értelmetlen válaszokat generálhat. Ezen túlmenően fizikai, térbeli és időbeli kérdések esetén nem felel meg a tényszerűségnek és a józan észnek, és a matematikai érvelés terén is nehézségei vannak. Az OpenAI szerint nehézségei vannak az olyan kérdésekkel, mint például: „Ha beteszem a sajtot a hűtőbe, megolvad?”. Gyengén teljesít, amikor tervez vagy módszeresen gondolkodik. Amikor az MBA záróvizsgán tesztelték, meglepő hibákat vétett a 6. osztályos szintű matematikában, ami hatalmas hibákat okozhat a komolyabb későbbi műveletekben. A kutatás megállapította, hogy a Chat GPT nem volt képes kezelni a fejlettebb folyamatelemzési kérdéseket, még akkor sem, ha azok szabványos sablonokon alapulnak. Ez magában foglalja a több termékkel rendelkező folyamatokat és a sztochasztikus hatásokkal, például a kereslet változékonyságával kapcsolatos problémákat.

Az emberi szimbolika és sajátosságok mély megértése

Az MI-nak az emberek teljes szimbolikus világában kell dolgoznia, beleértve az absztrakciós képességet, a testreszabást és a részleges hivatkozások megértését. A gépnek képesnek kell lennie értelmezni az emberek beszédének kétértelműségeit és hiányos mondatait ahhoz, hogy értelmes beszélgetéseket folytathasson. Az emberi beszédminták gyakran érthetetlenek. A mesterséges intelligenciának pontosan úgy kell beszélnie, mint az embernek? Reálisan nézve ugyanolyan lehet, mintha egy ember beszélgetne egy barátjával, lazán strukturált nyelvezettel, beleértve ésszerű mennyiségű „Tényleg?”-et, „Tetszik”-et, hiányos vagy rosszul formált mondatokat, kétértelműségeket, szemantikai absztrakciókat, személyes utalásokat és józan következtetéseket. Az emberi beszéd ezen sajátosságai azonban nem szabad, hogy elnyomják a kommunikációt, és ezáltal érthetetlenné tegyék azt.

Egyéni válaszok nyújtása

A mesterséges intelligenciának képesnek kell lennie arra, hogy testre szabja és megismerje a felhasználó világát. A ChatGPT gyakran kitalálja a felhasználó szándékát ahelyett, hogy tisztázó kérdéseket tenne fel. Ezenkívül, mivel a ChatGPT egy teljesen lezárt információs modell, nem képes az interneten böngészni vagy keresni, hogy egyéni válaszokat adjon a felhasználónak. Az OpenAI szerint a ChatGPT azért korlátozott az egyéni válaszok tekintetében, mert „minden tokent egyformán súlyoz, és nincs fogalma arról, hogy mi a legfontosabb a megjósoláshoz, és mi a kevésbé fontos”. Az önfelügyelt célok esetében a feladatmeghatározás a kívánt feladat előrejelzési problémává kényszerítésére támaszkodik, míg végső soron a hasznos nyelvi rendszereket (mint például a virtuális asszisztenseket) talán jobb úgy elképzelni, hogy célvezérelt cselekvéseket hajtanak végre, nem pedig csak előrejelzéseket tesznek.

Ha a szó jelentése nem más, mint használati módja a nyelvben – honnan tudjuk akkor, hogy hogyan kell a szavakat használnunk? Nem szükséges-e valamilyen lelki tartalom meglétét előfeltételeznünk, tartalomét, mely mintegy életet ad a halott jeleknek,irányítja alkalmazásukat? Hiszen megértjük a szó jelentését, amikor halljuk vagy kimondjuk; egy csapásra megragadjuk; és amit így megragadunk, az mégiscsak valami más, mint az időben kiterjedt »használat«! Ha pl. valaki a »kocka« szót mondja nekem, tudom, hogy mit jelent. Dehát valóban előttem lebeghet a szó minden alkalmazása, amikor így megértem? Mi az tulajdonképpen, ami előttünk lebeg, ha valamely szót megértünk? Nem valami olyasmi, mint egy kép? Nem lehet, hogy valamilyen kép?”

(Ludwig Wittgenstein)

Fognak egyszer a gépek emberi nyelven beszélni?
A mesterséges intelligenciának képesnek kell lennie arra, hogy testre szabja és megismerje a felhasználó világát. A ChatGPT gyakran kitalálja a felhasználó szándékát ahelyett, hogy tisztázó kérdéseket tenne fel (Fotó: Unsplash+)

Célorinentálttá válás

Amikor az emberek egy társsal dolgoznak, a koordináció nem csupán a szövegváltáson, hanem egy közös célon alapul. A mesterséges intelligenciának túl kell lépnie a kontextuális válaszokon, hogy célvezérelté váljon. A fejlődő ember-gép kapcsolatban mindkét félnek egy utazás részévé kell válnia egy cél elérése, egy probléma elkerülése vagy enyhítése, illetve információ megosztása érdekében. A ChatGPT és más LLM-ek még nem érték el az interakciónak ezt a szintjét. Az intelligens gépeknek túl kell lépniük az „input-to-output” válaszokon és chatbotként folytatott beszélgetéseken. Az intelligencia és az emberi szintű kommunikáció következő szintjének eléréséhez a kulcsfontosságú területeken ugrásszerű képességfejlesztésre van szükség: a tudás átstrukturálására, több készség integrálására és a kontextushoz való alkalmazkodás biztosítására.

A beszélgető mesterséges intelligenciák következő szintjéhez vezető út

Az olyan LLM-ek, mint a ChatGPT, még mindig rendelkeznek hiányosságokkal a kognitív képességek terén, amelyek szükségesek ahhoz, hogy a társalgási MI-t a következő szintre emeljék. A hiányzó kompetenciák közé tartozik a logikai gondolkodás, az időbeli gondolkodás, a numerikus gondolkodás és az általános képesség a célorientáltságra és a részfeladatok meghatározására egy nagyobb feladat elérése érdekében. A ChatGPT és más LLM-ek tudással kapcsolatos korlátait a Thrill-K megközelítéssel, a visszakeresés és a folyamatos tanulás hozzáadásával lehet kezelni. Az MI számára a tudás három helyen található:

  • Azonnali tudás: A tudás általánosan használt és folyamatos függvények, melyek hatékonyan közelíthetők, és a leggyorsabb és legdrágább rétegben állnak rendelkezésre a parametrikus memórián belül a neurális hálózat vagy más munkamemória más ML-feldolgozásához. A ChatGPT jelenleg ezt a végponttól végpontig tartó mélytanulási rendszert használja, de ki kell bővíteni más tudásforrásokkal, hogy hatékonyabb legyen az emberi társ.
  • Készenléti tudás: A mesterséges intelligencia rendszer számára értékes, de nem annyira gyakran használt tudás, mely egy szomszédos strukturált tudásbázisban áll rendelkezésre, szükség szerinti kinyeréssel. Megnövelt erősségű reprezentációt igényel a diszkrét entitások esetében, vagy általánosítva és rugalmasan kell tartani a különböző újszerű felhasználásokhoz. A készenléti tudáson alapuló cselekvések vagy eredmények feldolgozást és belső feloldást igényelnek, lehetővé téve a mesterséges intelligencia számára, hogy emberi társként tanuljon és alkalmazkodjon.
  • Visszakapott külső tudás: Szükség lenne egy hatalmas online tárból származó információra, mely a mesterséges intelligencia rendszeren kívül is elérhető lenne, hogy szükség esetén lekérdezhető legyen. Ez lehetővé teszi az MI számára, hogy az emberi társ számára az információk többféle modalitását felhasználva testre szabja a válaszokat, indoklással ellátott elemzést nyújtson, és megmagyarázza az információforrásokat és a következtetéshez vezető utat.

A gépi nyelvtől az emberi beszédig vezető út az emberektől az egyszerű bináris számjegyek számítógépbe történő bevitelén át az egyszerű feladatok elvégzésére szolgáló virtuális asszisztensek otthonunkba való behozásáig, valamint az olyan LLM-ektől, mint a ChatGPT, érces válaszok kéréséig és fogadásáig vezetett. Az LLM-ek terén a közelmúltban elért nagy előrelépés ellenére a társalgási mesterséges intelligencia következő szintjéhez vezető út a tudás átstrukturálását, a többszörös intelligenciát és a kontextushoz való alkalmazkodást igényli, hogy olyan mesterséges intelligenciát lehessen létrehozni, amely valódi emberi társ.

Ha a nyelvben gondolkodom, úgy a nyelvi kifejezés mellett nem lebegnek még »jelentések« is előttem; hanem a nyelv maga a gondolkodás közege. Az a többlet, ami a »gondolkodó beszédet« a »gondolattalan beszédtől« megkülönbözteti, nem valami külön ’lelki’ folyamat, ti. A gondolkodás, mely a gondolattalan beszéd folyamatát mintegy kísérve, azt értelmessé teszi.”

(Ludwig Wittgenstein)

Fognak egyszer a gépek emberi nyelven beszélni?
A mesterséges intelligencia rendszer számára értékes, de nem annyira gyakran használt tudás, mely egy szomszédos strukturált tudásbázisban áll rendelkezésre, szükség szerinti kinyeréssel. Megnövelt erősségű reprezentációt igényel a diszkrét entitások esetében, vagy általánosítva és rugalmasan kell tartani a különböző újszerű felhasználásokhoz (Fotó: Unsplash+)

Az emberi nyelv és tudat közötti elválaszthatatlan kapcsolat

Ludwig Wittgenstein osztrák filozófus egyszer azt mondta: „A nyelvem határai jelentik a világom határait”. Ez felveti a kérdést: vajon különböző világokban élünk-e attól függően, hogy milyen nyelven beszélünk? Minden nyelv a szavak és nyelvtani szerkezetek egyedi palettáját nyújtja beszélőinek, ami lehetővé teszi számukra, hogy képzeletüket mondatokban és szövegekben materializálják. Kérjünk meg egy olyan személyt, aki két nyelvet beszél anyanyelvi szinten, hogy írjon pontosan ugyanazt a szöveget mindkét nyelven. Most fordíttassa le a szöveget egy harmadik, semleges nyelvre. Látni fogják, hogy bár ugyanaz az író ugyanazokat az eseményeket írta le, a két fordítás nem azonos. Ez azért van így, mert a paletták, melyek az író rendelkezésére álltak, amikor eredetileg a szövegeket megalkotta, különböző eszközöket biztosítottak számára. Egyes fogalmak, melyeket az egyik nyelvben elegánsan megragadnak, a másikban egyáltalán nem léteznek. Ez nemcsak a beszélők kommunikációs képességét korlátozza, hanem azt is befolyásolja, hogyan értelmezik a körülöttük zajló eseményeket. A nyelv ugyanis az az eszköz, mellyel értelmet adunk, nos, mindennek.

A gondolkodás nem testetlen folyamat, mely a beszédnek életet és értelmet kölcsönöz, és melyet a beszédről le lehetne választani, mint ahogyan, mondjuk, a Gonosz elveszi Schlemiehl árnyékát a földről. De hogyan: »nem testetlen folyamat«? Ismerek tehát testetlen folyamatokat, a gondolkodás azonban nem közülük való? Nem; a »testetlen folyamat« szót zavaromban vettem segítségül, mivel a »gondolkodás« szó jelentését primitív módon akartam megmagyarázni. A gondolkodás nem-primitív magyarázata pedig – a gondolkodás jelenségének az emberi életteljesség összefüggésében való leírása lesz.”

(Ludwig Wittgenstein)

George Orwell 1984 című műve baljós képet fest egy disztópikus jövőről, ahol az emberek szörnyű körülmények között élnek a „Nagy Testvér” által vezetett kormány állandó felügyelete alatt. Orwell regényében a kormány többféle módon gyakorolja az ellenőrzést a tömegek felett, melyek közül a legriasztóbb az angol nyelv manipulálása a politikai ellenvélemény megakadályozása érdekében. Az új nyelv, a newspeak (újbeszél) megalkotásával a kormány megpróbálta lehetetlenné tenni, hogy az egyénnek még csak eszébe se jusson árulást elkövetni az uralkodó párt ellen. Már az is bűncselekménynek számított, ha valaki csak gondolatban szokatlan politikai ideológiával foglalkozott: gondolat-bűncselekménynek minősült.

A Newspeak tehát korlátozott szókincsből állt, kihagyva azokat az angol szavakat és kifejezéseket, melyeket károsnak vagy alkalmasnak ítéltek arra, hogy a tömegeket olyan kognitív erővel ruházzák fel, mely lehetővé teszi a lázadás megfontolását. Az elképzelés az volt, hogy a szókincs korlátozásával, mellyel az emberek kifejezhették a másként gondolkodást, a lázadás lehetetlenné válik. Röviden, az uralkodó párt megpróbálta felülírni az emberi tudatosságot azáltal, hogy korlátozta az emberek rendelkezésére álló nyelvet. Ezt a szándékot nyíltan elismerte a newspeak-szótárat készítő egyik nyelvész, Syme. A regény főhősével, Winstonnal az Igazságügyi Minisztérium kávézójában folytatott beszélgetésben Syme szenvedélyesen kijelenti: „Hát nem látod, hogy a Newspeak egész célja a gondolkodás körének leszűkítése? A végén szó szerint lehetetlenné tesszük a gondolatbűnözést, mert nem lesznek szavak, melyekkel kifejezhetnénk. Minden fogalmat, amire valaha is szükség lehet, pontosan egyetlen szóval fogunk kifejezni, melynek jelentése mereven meghatározott, és minden mellékjelentését kidörzsöljük és elfelejtjük.

Fognak egyszer a gépek emberi nyelven beszélni?
A Newspeak tehát korlátozott szókincsből állt, kihagyva azokat az angol szavakat és kifejezéseket, melyeket károsnak vagy alkalmasnak ítéltek arra, hogy a tömegeket olyan kognitív erővel ruházzák fel, mely lehetővé teszi a lázadás megfontolását (Fotó: Unsplash+)

Ez azonban felveti a kérdést: függetlenedhet-e a nyelv az emberi tudattól, vagy a nyelv valami velünk született dolog, kifejezése pedig elkerülhetetlen? Ahhoz, hogy erre a kérdésre választ kapjunk, először is fontos definiálni a nyelvet és a tudatot. A nyelv általunk választott definíciója a következő: a hangok vagy szimbólumok segítségével történő kommunikáció rendszere, mely érzéseket, gondolatokat, eszméket és tapasztalatokat fejez ki. A tudatosság ezzel szemben azokat az eszméket, gondolatokat és érzéseket írja le, melyeknek tudatában vagyunk. A XX. század folyamán Noam Chomsky nyelvész kidolgozta a „veleszületettségi hipotézist”, mely elmélet szerint az ember genetikailag fel van ruházva egy magasan strukturált nyelvtanulási mechanizmussal. Chomsky elmélete két jelenségre világít rá:

A természetes nyelvek szerkezetileg nagyon összetettek. A gyermekek jellemzően nagyon fiatalon, szinte formális oktatás nélkül érik el az anyanyelvük folyékony elsajátítását. E két pont látszólag kibékíthetetlen kapcsolata arra készteti Chomskyt, hogy azt sugallja, hogy az emberek a gondolatok és érzelmek széles skálájának kifejezésére való képességgel születnek. Az, hogy ténylegesen mennyit fejez ki az ember élete során, változó, és más tényezőktől függ, például attól, hogy milyen környezetbe kerülnek az emberek. Ez a világnézet elutasítja azt az elképzelést, hogy az emberi elme születéskor „tabula rasa” (üres lap) , és azt állítja, hogy mi, emberek bizonyos „veleszületett hajlamokkal, diszpozíciókkal, szokásokkal és természetes lehetőségekkel” vagyunk felruházva. Ezt az elképzelést szem előtt tartja, az emberek olyan tudattal születnek, mely meghaladja a párt által a newspeak megalkotásával felállított mesterséges paramétereket.

Chomsky veleszületettség-hipotézisének egyik legizgalmasabb gondolata az „ingerek szegénysége”, mely szerint a gyermekek nem kapnak elegendő ingert a környezetükben ahhoz, hogy pusztán tapasztalat útján elsajátítsák anyanyelvük minden aspektusát. Ezt az ingerhiányt csak a veleszületett önkifejezési képességgel lehet leküzdeni, ami megerősíti a veleszületettségi hipotézis érvényességét.

Nem ismerjük fel a mindennapi nyelvjátékok csodálatos sokféleségét, mert nyelvünk külső burkolata mindent azonosnak lát.”

(Ludwig Wittgenstein)

Fognak egyszer a gépek emberi nyelven beszélni?
A természetes nyelvek szerkezetileg nagyon összetettek. A gyermekek jellemzően nagyon fiatalon, szinte formális oktatás nélkül érik el az anyanyelvük folyékony elsajátítását. E két pont látszólag kibékíthetetlen kapcsolata arra készteti Chomskyt, hogy azt sugallja, hogy az emberek a gondolatok és érzelmek széles skálájának kifejezésére való képességgel születnek (Fotó: Unsplash+)

Az ingerszegénység közeli változata a „Platón problémája”, mely kifejezés a Menónban, egy szókratészi dialógusban szereplő interakció leírására született, ahol Szókratész tudomást szerez egy rabszolgáról, aki annak ellenére mutat ismereteket a geometriai fogalmakról, hogy azokat formálisan soha nem tanulta. Ez az interakció azt az elképzelést írja le, hogy mi, emberek, a tapasztalatainkat messze meghaladó tudással gazdagodunk. Hasonlóképpen, annak ellenére, hogy soha nem ismerjük meg teljesen az anyanyelvünkben található összes struktúrát, fiatal korban gyorsan elsajátítjuk ezeket a struktúrákat. Chomsky nézeteit később a neves kanadai pszichológus és nyelvész, Steven Pinker is visszhangra talált, aki szintén azt állítja, hogy az emberi nyelv genetikai örökség. Indoklása szerint minden nyelv, annak ellenére, hogy egyedi, mégis közös a főnevek, igék, tagadószók, kérdések, valamint a különböző időmértékek közös kerete. A nyelv egyetemessége nem csak a beszélt nyelvre korlátozódik, hiszen a süketnek és némának született embereknél is kialakul az a képesség, hogy gesztusok és jelbeszéd segítségével fejezzék ki érzéseiket, gondolataikat és ötleteiket. Az emberek tehát az ember által létrehozott konvencióktól és akadályoktól függetlenül képesek „kinőni a nyelvükből”, mivel végső soron a veleszületett késztetés fogja felszabadítani az emberi tudatot a mesterségesen korlátozott nyelvi konvenciók béklyói alól.

Fognak egyszer a gépek emberi nyelven beszélni?
Az ingerszegénység közeli változata a „Platón problémája”, mely kifejezés a Menónban, egy szókratészi dialógusban szereplő interakció leírására született, ahol Szókratész tudomást szerez egy rabszolgáról, aki annak ellenére mutat ismereteket a geometriai fogalmakról, hogy azokat formálisan soha nem tanulta (Fotó: Unsplash+)

Ezt legjobban Steven Pinker „A nyelvi ösztön” című könyvéből vett idézet fejezi ki, amelyben azt írja, hogy „az emberek olyannyira veleszületetten nyelvi ösztönökkel rendelkeznek, hogy nem tudják jobban elnyomni a nyelvtanulás és nyelvhasználat képességét, mint ahogyan azt az ösztönt sem tudják elnyomni, hogy visszahúzzák a kezüket egy forró felületről”. Ezt a nézetet szem előtt tartva, az 1984-ben a tömegekre egy korlátozott nyelv, a newspeak kialakításával bevezetett korlátozások soha nem vezethettek volna az emberi tudatosság korlátozásához, mivel végső soron az emberi kifejezés ereje eredendő; az emberi nyelv kifejeződése elkerülhetetlen.

A filozófia nem tanítás, hanem tevékenység. Egy filozófiai mű lényegében magyarázatokból áll.”

(Ludwig Wittgenstein)

Fognak egyszer a gépek emberi nyelven beszélni?

(Kiemelt kép: Unsplash+)

PODCAST

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek