Arisztotelész szillogizmusai és a nagy nyelvi modellek

Tölgyes László András

2023. nov 16.

MEGOSZTÁS

Az elmúlt néhány évben jelentős előrelépések történtek a gépi tanulás és a mélytanulási technológiák terén. Ennek eredményeképpen a fejlesztők képesek voltak olyan MI-eszközöket készíteni, melyek valóban képesek úgy gondolkodni, mint egy ember. Képesek összetett feladatok elvégzésére, valamint az adatok és minták elemzése alapján logikus döntéseket hozni, ami csak az embereknek volt fenntartva.

(Kiemelt kép: Unspash+)

A nagy nyelvi modellek, például a ChatGPT forradalma sokakat közelebb hozott mindenkit a mesterséges intelligencia területéhez. Ezen új technológiák etikai, társadalmi, sőt politikai hatásai egyre fontosabbá és szükségesebbé válnak. Megpróbáltunk a ChatGPT-vel csevegni, hogy megértsük a képességeit abból a szempontból, amit filozófiai szempontból határozhatnánk meg. Kezdjük azzal, hogy megértjük, mi is az arisztotelészi szillogizmus, majd kipróbáljuk, hogy a ChatGPT rendelkezik-e az ilyen típusú érveléshez szükséges képességekkel. Arisztotelész egy Kr. e. IV. századi filozófus és tudós (a két tudományág nem volt mindig annyira elválasztva szigorúan egymástól, mint manapság). Elvetette az emberekben veleszületett eszmék koncepcióját, és tanulmányait a logikai gondolkodásra összpontosította, mely az embereket előfeltevések levezetésére készteti. Arisztotelész számára a logika a deduktív és demonstratív érvelés, melyet ő szillogizmusnak, a „par excellence” tudományos érvelésnek nevez. Ez olyan érvelés, mely az egyetemesből indul ki, hogy bizonyítsa a konkrétat. Azért is demonstratív érvelés, mert a tudományoknak bizonyítaniuk kell azt, amit állítanak. Gondoljunk csak a középiskolában tanult geometriára, melyben posztulátumokból kiindulva bizonyítottunk különböző tételeket. Arisztotelész célja tehát egy olyan helyes nyelv megalkotása volt, mely lehetővé teszi ezt a bizonyítást.

Arisztotelész szillogizmusai és a nagy nyelvi modellek — Arisztotelész számára a logika a deduktív és demonstratív érvelés, melyet ő szillogizmusnak, a „par excellence” tudományos érvelésnek nevez. Ez olyan érvelés, mely az egyetemesből indul ki, hogy bizonyítsa a konkrétat (Fotó: Unsplash+)

A szillogizmus három tételből vagy három mondatból álló érvelés. Két premisszából és egy konklúzióból. Az A premisszának „nagyobbnak” kell lennie, mint a B premisszának (vagy „kisebb” premisszának), vagyis nagyobb fokú egyetemességgel kell rendelkeznie. A nagyobb premisszának és a kisebb premisszának két szélsősége van, melyek egy „középső” úgynevezett „terminuson” keresztül kapcsolódnak egymáshoz. A középső terminusnak ezután összekötő szerepe is van, de aztán a konklúzióban végül el is tűnik. Így egy érv vagy szillogizmus abban a pillanatban helyes, amikor egy sor szabály, nevezetesen az imént leírtak, betartásra kerülnek. Nyilvánvaló, hogy az A és B premisszáknak igaznak kell lenniük ahhoz, hogy igaz legyen majd a következtetés. Ellenkező esetben az érvelés lehet helyes, de vezethet igaz, de helytelen következtetéshez is. Lássuk most, hogyan kell szillogizmusokat felépíteni.

Az első típusú szillogizmus

Ebben a típusú szillogizmusban a nagyobb premisszában (A) a középső kifejezés alany, a kisebb premisszában (B) pedig nominális predikátuma.

A: Minden „ember” halandó.

B: Szókratész „ember”.

C: Szókratész halandó.

Vegyük észre, hogy az A nagyobb fokú egyetemességgel rendelkezik, mivel minden emberre vonatkozik, míg a B csak egy emberre vonatkozik. Az A-ban az „emberek” középső kifejezés az alany. Míg a B-ben az „egy ember” középső kifejezés a nominális predikátum. A C következtetésben a középső kifejezés eltűnik, de összeköti a két végletet: [„halandók”, „Szókratész”]. A következtetés a következőképpen épül fel. A C alanya a kisebb premissza alanyává válik, a C predikátuma pedig a nagyobb premissza predikátumává. Nyilvánvaló, hogy a fordítottja nem működne, mert különben valami univerzálisabbat kapnánk alanyként, és valami konkrétat tulajdonítanánk neki: „A halandók Szókratész” például.

A második típusú szillogizmus

Ebben a szillogizmustípusban a középső kifejezés mindkét premisszában (A és B) predikátumként szerepel. A konklúzióban itt is eltűnik a középső terminus, hogy kapcsolatot teremtsen a két premissza között. Nézzünk egy példát.

A: Egyetlen kő sem „állat”.

B: A macska „állat”.

C: A macska nem kő.

Ebben az esetben van egy általánosabb negatív kifejezésünk (A), és egy specifikus (B) affirmatív. Figyeljük meg, hogy mindkét premisszában (nagyobb és kisebb) az „állat” középső kifejezés ugyanott áll, mint egy predikátum. Következésképpen negatív prepozícióval rendelkezünk, mely a specifikus macska kifejezést negatív módon köti össze az általánosabb, kőnek lenni kifejezéssel, tehát a macska nem kő. Nézzünk egy másik példát.

A: Minden bálna „tengeri állat”.

B: Néhány emlős „tengeri állat”.

C: Néhány emlős bálna.

Az előző példánál is alkalmazott logikai érvelést követve kiiktathatjuk a középső kifejezést, és a B konkrét prepozíciót összekapcsolhatjuk A-val, így azt az eredményt kapjuk, hogy néhány emlős bálna.

A harmadik típusú szillogizmus

A harmadik típusú szillogizmusban a középső terminus mindkét premisszában (A és B) alanyként szerepel. Nézzünk rögtön egy példát.

A: „Az összes Simpson családtag” sárga.

B: „Az összes Simpson családtag” kitalált karakter.

C: Néhány kitalált szereplő sárga.

Ismét eltűnnek a középső kifejezések, és összekötjük A-t B-vel. Vigyázzunk azzal, hogy néhány fiktív szereplő sárga, mert a B prepozíció fennmaradó végletében nincs meghatározva, hogy mind, sőt, helytelen lenne azt mondani, hogy minden fiktív szereplő sárga (Amerika kapitány például biztos nem az mint tudjuk:)).

Szillogizmus és ChatGPT

A ChatGPT a legismertebb és legszélesebb körben használt alkalmazás, mely nagy nyelvi modelleken, azaz nagy nyelvi megértési és generálási képességgel rendelkező mesterséges intelligenciamodelleken alapul. Ilyenkor természetesen felmerül a kérdés, hogy ez az eszköz valójában mennyire képes gondolkodni, illetve mennyire okosan használja újra az „adatbázisában” lévő szövegdarabokat. Ezért szerettük volna megpróbálni megkérni a ChatGPT-t, hogy szillogizmusokon alapuló érvelést végezzen, majd néhány premissza alapján következtetéseket vonjon le, mint a korábban látott esetekben, hogy lássuk, a levont következtetések helyesek-e. De mielőtt mindezt megtennénk, meg kell találnunk a módját annak, hogy ChatGPT-nek megmondjuk, hogy ne használja a múltbeli információit vagy tudását. Ellenkező esetben az első példa A és B premisszái (A: Minden „ember” halandó, B: Szókratész „ember2) mellett csak azért válaszolhatna C-vel (Szókratész halandó), mert ezt a példát már látta, amikor ezen a példán képezték ki. (Próbálják ki ezt a kedves olvasók így is és úgy is!)

Most már készen állunk arra, hogy megpróbáljuk megkérni a ChatGPT-t, hogy a korábbi szillogisztikus érvelés premisszáiból következtessen. Kezdjük az első típusú, egyszerű szillogizmussal. Láthatjuk, hogy a modell a „Szókratész halandó” helyes következtetéssel válaszol. Most lefuttathatjuk ugyanezt a tesztet, de a második típusú szillogizmussal. A ChatGPT ismét meglepően jól válaszol, és arra következtet, hogy „Egyes emlősök bálnák”. Próbáljunk ki egy másik, második típusú szillogizmust, csak hogy biztosak legyünk benne, hogy nem véletlen volt-e ezt. Valóban, a ChatGPT továbbra is helyesen válaszol. Most a legnehezebb tesztet a harmadik típusú szillogizmussal végezzük el. A ChatGPT által levont következtetés a következő: „Minden Simpson családtag nevű kitalált karakter sárga”, ami eltér attól, amit vártunk: „Néhány kitalált karakter sárga”. A ChatGPT kimenete helyes, de vegyük észre, hogy nem ad hozzá semmilyen információt az (A) és (B) premisszákhoz, tehát egyszerűen csak másképp dolgozza fel az információt. Ezért a ChatGPT-t gyakran vádolják azzal, hogy csak az általa ismert dolgokat írja át másképp, és soha nem hoz semmi újat. A ChatGPT új funkciójával, amikor a modellnek nehéz dolgokra kell válaszolnia, két megoldás közül választhat, de így mindkettő rossz.

Nehéz az MI érvelési képességeit értékelni

Mit mondhatunk arról, amit eddig a cikkben olvashattunk? Egyszerűen csak arra szeretnénk felhívni a figyelmet, hogy milyen nehéz egy olyan nagy nyelvi modell, mint a ChatGPT érvelési képességeit értékelni. Ebben a cikkben arisztotelészi szillogizmusok alapján „értékeltük” a modellt, de a mai napig léteznek tudományos és statisztikailag értelmesebb mérőszámok. A GPT-4 például jól teljesített több egyetemi vizsgán és az ügyvédi vizsgán is. Azonban még ebből a néhány tesztből is azt mondhatnánk, hogy a ChatGPT-től nem várhatunk nagyon bonyolult érvelést, a harmadik típusú szillogizmusokban láttuk a hibáit. Ugyanakkor az sem helytelen, ha azt mondjuk, hogy egyszerűen csak átírja a már ismert szövegeket. Ehelyett úgy gondoljuk, hogy képes egyszerű érvelésre és új információk létrehozására abból, amivel már rendelkezik. Ha az érvelési képességei fejlődnek, a jövőben megszokottá válik, hogy új információkat hozzon létre a világról, és új dolgokat fedezzen fel, egyszerűen a modellel való helyes interakcióval.

A mesterséges intelligencia valóban gondolkodik?

Az első univerzális számítógépek kifejlesztése óta a tudósok feltételezik egy mesterséges tudat létezését; egy olyan konstruált rendszerét, mely képes tükrözni az emberi agyban lejátszódó összetett kölcsönhatásokat. Bár egyes közszereplők nyíltan rettegnek a közelgő Kiborg-Apokalipszistől, a legtöbb ember számára a mesterséges intelligencia manapság inkább olyan eszközökre és alkalmazásokra utal, melyek segítségével gyorsabban végezhetjük el a munkánkat, mint androidokra és mesterséges emberekre. A mesterséges intelligenciát ma már túlnyomórészt egy bizonyos típusú technológia szűk körű felhasználásának tekintik, megkülönböztetve a mesterséges általános intelligenciától (AGI), mely egy sokkal tágabb fogalom, és magában foglalja a szintetikus tudatot is.

Figyelembe véve a mesterséges intelligencia területén az elmúlt évtizedben bekövetkezett növekedést és a folyamatban lévő hatalmas beruházásokat, érdemes megvizsgálni, hogy milyen messzire jutottunk a Terminátorok, Replikánsok felé vezető úton, és milyen problémák merültek fel. Sok tudós és gondolkodó úgy véli, hogy az AGI az egyetemesség fogalmán alapuló tudományos elkerülhetetlenség, míg mások szerint ontológiai fizikai korlátok akadályozzák a tudat újrateremtését. A nézeteltérés tulajdonképpen filozófiai jellegű; nincsenek olyan empirikus bizonyítékok, melyek átfogóan alátámasztanák bármelyik hipotézist. Ami világos, az az, hogy a tudósok rendkívül eredményesek voltak bizonyos emberi képességek újrateremtésében, sőt továbbfejlesztésében, míg mások reprodukálásában teljesen sikertelenek.

Szintetikus entitások

A mesterséges, szintetikus tudatosság gondolata, mely hasonlíthatna az emberhez hasonló intelligenciára, elképesztő etikai és morális kérdéseket vet fel. Ez egy hatalmas és lenyűgöző téma, mellyel itt most nem foglalkozunk. Ehelyett inkább az ilyen entitások kifejlesztésének gyakorlati akadályait és filozófiai következményeit fogjuk megvizsgálni. A mesterséges intelligencia napjainkban a technológiai kutatás egyik vezető fejlesztési iránya, olyannyira, hogy szinte minden más technológiába beszivárog. Az MI a fejlett analitika és az automatizálás hatékonyságának és megbízhatóságának növekedésével továbbra is újra fogja definiálni a vállalkozások működését, ami azt jelenti, hogy azok a vállalatok, melyek nem alkalmazkodnak, azt kockáztatják, hogy lemaradnak. Az olyan új MI-technológiák, mint amilyenek az autonóm autókban találhatók, vagy a teljesen új, eredeti újdonságokat konstruálni képes generatív adverzív hálózatok, korábban elképzelhetetlen alkalmazások és ötletek kifejlesztéséhez vezethetnek.

Gondolkodó gépek

Ezek a fejlesztések a „gondolkodó gépek” alapgondolatán alapulnak; olyan szoftvereken, melyek képesek az emberi agy bizonyos kognitív funkcióit leutánozni. A mesterséges intelligenciának nincs egységes definíciója (még az „intelligencia” kifejezés is szubjektív), de leggyakrabban olyan alkalmazásokat értünk alatta, melyek képesek érzékelni a környezetüket, hogy elérjék programozható céljaikat. A tanulásra képes, azaz a keményen kódoltakon túlmutató megértésre képes gépek a mesterséges intelligencia fejlesztésének legnagyobb részhalmazát alkotják. A gépi tanulás vagy mélytanulási algoritmusok gyakran mesterséges neurális hálózatokon alapulnak. Ezek olyan számítástechnikai rendszerek, amelyeket kifejezetten az emberi agy működését modellezik.

Ezeket „gondolkodó gépeknek” nevezzük, annak ellenére, hogy nem úgy gondolkodnak, mint az emberek. Érzékelik a környezetüket, de nem tudatosak. A számítógépek ugyanúgy rendelkeznek memóriával, mint a tudatos lények, és a modern mesterséges intelligencia rendszerek képesek az információs inputok alapján előre látni vagy jósolni (ez az egyik módja annak, hogy egy mesterséges intelligencia előrejelző modellt tudjon alkotni, például az üzleti életben vagy az egészségügyben). Ezeket a képességeket mind a tudatosság szükséges aspektusainak tartják, de egy gép csak rendkívül szűk körben képes ezeket megvalósítani. A mesterséges intelligencia „rugalmatlan”, és képtelen előre látni vagy emlékezni a meghatározott, korlátozott programozásán kívül. Például egy rendkívül fejlett gépi tanuló algoritmus, melyet arra terveztek, hogy előrejelzéseket készítsen a közúti forgalomban előforduló mintákról, nem tudja intelligenciáját átcsoportosítani arra, hogy beszélgetést folytasson vagy játékot játsszon.

A mesterséges intelligencia rugalmasságának ilyen módon történő elősegítése jelentős kihívást jelent. Azonban nem biztos, hogy a tudatosságnak ez a legnehezebb újrateremtése. A szubjektív tapasztalat, azaz a belső, gyakran megmagyarázhatatlan mentális állapotok és reakciók fogalmát a pszichoterapeuták és a filozófusok is gyakran a tudat „nagy kérdésének” tekintik. Thomas Nagel írta: „egy organizmusnak akkor és csak akkor vannak tudatos mentális állapotai, ha van valami, ami olyan, mintha az a szervezet lenne. Valami, ami olyan, mintha az a szervezet számára”. Más szóval, nem elég, ha egy gép gondolkodik: tudnia kell, hogy gondolkodik, és a gondolataitól függetlenül is éreznie kell a létezését. Descartes híres mondása: „Gondolkodom, tehát vagyok”, hogy illusztrálja, hogy neki van elméje, ami különbözik a fizikai gondolkodó agytól. Ezt a gondolatot gyakran összekapcsolják a qualia fogalmával: az érzetek szubjektív értelmezésével, mely nem magyarázható és nem is kiszámítható. A filozófusok gyakran leírhatják a fájdalomérzet „fájdalmasságát” vagy a veleszületett „vörösséget”, melyet a vörös szín érzékelésekor tapasztalunk. Tudományosan le tudjuk írni, mi történik, amikor a fénysugarak a szemünkben lévő csapokkal érintkeznek, és össze tudjuk hasonlítani más hasonló színekkel, melyeket már láttunk, de nincs mód arra, hogy két ember objektíven összehasonlítsa a vörös színnel kapcsolatos személyes élményét. Ez a fogalom eleve problematikus a tudósok számára, és többnyire hajlamosak figyelmen kívül hagyni. Ez azonban egyike a sok megfoghatatlan, meghatározhatatlan absztrakciónak, melyek kétségtelenül léteznek, mind az emberi elmén belül, mind azon kívül, és amelyeket nem lehet tudományosan meghatározni.

Absztrakt fogalmakba ragadva

Az olyan absztrakt fogalmak, mint a kreativitás, az emberi vágyak, a társas megismerés (vagy a közös megértés), az értelem és a szabad akarat, minden tudatos lény szükségszerű megfontolásai, de bebizonyosodott, hogy matematikailag rendkívül nehéz formalizálni őket. Ez lehetetlenné teszi, hogy lefordítsuk őket számítógépes kódra, és ezért lehetetlen, hogy lefordítsuk őket egy gépre. Nem lehet őket megmagyarázni vagy újraalkotni gépi tanulással vagy mélytanulási algoritmusokkal; bármilyen nagy is legyen az adathalmaz, a szoftver nem lesz képes megérteni vagy elsajátítani az olyan egyedülállóan emberi tulajdonságokat, mint az empátia vagy az érzékenység. Ehhez olyan beépített modellekkel kellene programozni, amelyek leírják, hogy mit jelentenek ezek a fogalmak, olyan kifejezésekkel, amelyeket a program meg tud érteni.

A helyes tudásstruktúrák kifejlesztése az egyik olyan terület, ahol az MI-kutatók javítják a mesterséges intelligencia hatékonyságát, hogy tovább egészítsék ki az egyre nagyobb adathalmazokat. A tudósok azonban még messze vannak attól, hogy a megfoghatatlan, érzelmileg fejlett jelenségeket formális példányokként pontosan megjelenítsék. A modern számítástechnikai rendszerek potenciális kapacitását a következő (talán leegyszerűsítő) mondással lehet összefoglalni: „Ha meg tudsz érteni egy feladatot, akkor le is tudod programozni2. Ez egyrészt az emberi megértés teljes spektrumából származó és abból inspirálódó alkalmazások hatalmas lehetőségét sugallja. Lényegében gyakorlatilag minden, ami megismerhető és egyértelmű, matematikailag formalizálható és programozható. Másrészt ez nagyon természetesen a felfedezéseinket az anyagban gyökerező, egyértelmű fogalmakra korlátozza, nem pedig a metafizika és a filozófia területére.