Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

A szemantikus web története

MEGOSZTÁS

A 2000-es évek elején az egyik legnépszerűbb téma a szemantikus web volt. A Szemantikus Web, más néven az adatok webje vagy Web 3.0, megpróbált struktúrát adni a weboldalak tartalmának, hogy azok ne csak az emberek, hanem a gépek számára is érthetőek legyenek.

(Kiemelt kép: Unsplash+)

Emlékszik még valaki a szemantikus webre? Valószínűleg nem. Körülbelül két évtizeddel ezelőtt volt ez a divat, de manapság már ritkán említik. Miután merész elképzeléssel indult egy új webről, a szemantikus web fokozatosan veszített lendületéből, és apránként háttérbe is szorult. Mégsem volt soha egyfajta „számvetés” arról, hogy miért volt ez így. Egészen mostanáig, amikor a szemantikus web korifeusainak végre figyelembe kell vennie a bomlasztó generatív MI technológia jelenlétét. Sir Tim Berners-Lee 1999-ben, a World Wide Web Consortium (W3C) munkatársaként javasolta a szemantikus web (SW) koncepcióját. Az ötlet lényege az volt, hogy egy olyan adathálót hozzanak létre, melyet a gépek is képesek feldolgozni, lehetővé téve számukra, hogy megértsék az információk jelentését, és kapcsolatot teremtsenek a különböző adatok között. A szemantikus web Tim Berners-Lee második nagy világot megváltó digitális ötlete volt. A világháló megalkotójaként 1999-ben már régen világhírű személyiség volt. 1990-ben volt, amikor a svájci CERN vendégkutatójaként a Web megvalósítását javasolta főnökének, Mike Sendallnak, aki „homályosnak, de izgalmasnak” találta a javaslatot. Tim Berners-Lee elmondta, hogy szinte semmit sem talált fel, mert a hiperlinkek, az internetes protokollok és sok más elem már rendelkezésre állt. Mégsem tette meg senki azt a lépést, hogy mindezeket a helyükre tegye. Ahogy Tim Berners-Lee fogalmazott, „csak fogtam a hipertext ötletét, és összekötöttem a TCP és a DNS ötleteivel, és meg is volt a World Wide Web”. Egy kis lépés az ember számára…

A szemantikus web története
Az ötlet lényege az volt, hogy egy olyan adathálót hozzanak létre, melyet a gépek is képesek feldolgozni, lehetővé téve számukra, hogy megértsék az információk jelentését, és kapcsolatot teremtsenek a különböző adatok között (Fotó: Unsplash)

A szemantikus web víziója

A szemantikus web az adatok és intelligens tartalmak összekapcsolásával létrehozott tudásgráf, mely megkönnyíti a tartalom, a metaadatok és más információs objektumok gépi megértését és feldolgozását. Intelligensebb, könnyebb ügyfélélményt eredményez azáltal, hogy a tartalom képes megérteni és a leghasznosabb, az ügyfél igényeihez igazodó formában megjeleníteni magát. A szemantikus szabványok a web döntő fontosságú fejlődését nyitják meg a mesterséges intelligencia irányába, mely lehetővé teszi, hogy az általunk online közzétett tartalmakat a gépek által megérthető, összekapcsolható és újrakeverhető módon jelenítsük meg. A tartalomszerkezetek alapvető alapot képeznek egy megbízható gráfhoz vagy tudástérképhez, mely az alapvető természetes nyelvi feldolgozáson (NLP) és természetes nyelvi megértésen (NLU) túl a valódi mesterséges intelligenciához is szükséges. A mesterséges intelligencia megoldások mindig is hiánypótló alkalmazások maradnak, melyeket korlátozott tartalmi korpuszok alapján építenek fel, amíg nem léteznek a tartalomkészletekre vonatkozó struktúrák és szemantikai szabványok. A tartalom szemantikus webes megközelítésének alkalmazása közelebb viszi a kiadókat a globálisan feldolgozható tartalomkészletekhez.

A szemantikus web története
A tartalomszerkezetek alapvető alapot képeznek egy megbízható gráfhoz vagy tudástérképhez, mely az alapvető természetes nyelvi feldolgozáson (NLP) és természetes nyelvi megértésen (NLU) túl a valódi mesterséges intelligenciához is szükséges (Fotó: Unsplash)

A tartalommérnökök a tartalom és az adatok hatékonyabb és mozgékonyabb hálózatát hozzák létre azáltal, hogy először elemzik és strukturálják a weboldalakat alkotó különálló tartalmi elemeket, például az embereket, eseményeket, ötleteket, fogalmakat, termékeket. Ezekhez az elemekhez ezután egy-egy „címkét” rendelnek, mely szabványosított nyelven írja le a jelentésüket. Ha ilyen gépileg olvasható leírások vannak, akkor ezek összekapcsolhatók, hogy egy robusztusabb adathálózatot hozzanak létre, ahol a számítógépek képesek megtalálni, elolvasni és akár következtetéseket levonni egy-egy tartalmi egységről. A szemantikus adatok alkalmazását a web különböző helyein láthatjuk, például bizonyos keresési élményekben. Ennek a gazdag, új információs rétegnek köszönhetően a keresőmotorok és más botok képesek a legrelevánsabb tartalmat közvetlenül a felhasználónak nyújtani, a legfontosabb részletekre szerkesztve, melyekkel az embereknek időt és energiát takarítanak meg. A szemantikus web nem csak a hagyományos keresést javítja, hanem elősegíti a zökkenőmentesebb, intelligensebb és integráltabb ügyfélélmény-utakat is. A szemantikusan összekapcsolt és leírt adatokkal például egy digitális asszisztens helyi élőzenei ajánlásokat küldhet a felhasználóknak a környékükön. Ez úgy lenne lehetséges, hogy összegyűjti és összekapcsolja a weben közzétett különböző adatokat, például a közeli szórakozóhelyek által online közzétett információkat, és összeveti azokat a felhasználó által az online lejátszási listáin megosztani kívánt zene típusára vonatkozó adatokkal. A szemantikus web alkalmazásai végtelenek, de addig nem tudjuk kihasználni ezeket a lehetőségeket, amíg nem rendelkezünk a globális tudás valóban intelligens hálójával. Tartalmainkat „szemantikussá”, vagyis értelmes metaadatokkal és kapcsolatokkal jegyzetelté kell tennünk, hogy az unalmas és szunnyadó rögzített szöveget élő és elektromos összekapcsolt fogalmakká alakítsuk át. Ez az átalakítás sokkal dinamikusabbá teszi a webet, és lehetővé teszi, hogy ne csak a tartalom, hanem az adatok is szabadon és zökkenőmentesen közlekedjenek.

A szemantikus web története
A szemantikus web nem csak a hagyományos keresést javítja, hanem elősegíti a zökkenőmentesebb, intelligensebb és integráltabb ügyfélélmény-utakat is (Fotó: Unsplash)

Hogyan működik a gyakorlatban?

Ahhoz, hogy megértsük a szemantikus web kialakulásának elvét, képzeljünk el egy zenegépet. Ez a gép lejátssza azt a dalt, melyet a vendég a gombok megnyomásával kiválaszt. Mivel a zenegép korlátozott számú felvételt tartalmaz, melyeket kézzel kell kiválasztani, a szemantikus technológiák megjelenése előtti web nagyjából ugyanígy működött, és sokszor ugyanezekkel a korlátokkal rendelkezett. A felhasználóknak manuálisan kellett a korlátozott erőforrásokból: weboldalakból, könyvtárakból, különböző szervereken tárolt dokumentumokból kéréseket előhívniuk. A gépek nem tudták megtalálni, elolvasni, nemhogy használni ezeket a tartalmakat. Az évtizedek során a lekérhető zenei technológia a zenegépekből fejlődött, és olyan intelligens digitális platformokat adott nekünk, mint a Spotify vagy a Tidal. Ezek a „szemantikus zenei” szolgáltatások lehetővé teszik számunkra, hogy több millió dal közül felfedezzük a megfelelő tartalmat anélkül, hogy mindegyiket meghallgatnánk, ember és gép által összeállított zenei gyűjteményeket hozhatunk létre, és ami talán a legizgalmasabb, felfedezhetünk új dalokat, melyek megfelelnek az érdeklődési körünknek. Hogyan csinálja ezt a Spotify és a Tidal? Vagy hogy unokatestvéreik, a Netflix, a YouTube, az AirBNB és az Amazon hogyan valósítják meg az „ügyfélélmény varázslat” formáit? A szemantikailag gazdag Linked Data és tartalom felhasználásával. A web a szemantika irányába fejlődik, mióta Tim Berners-Lee víziójában ez csak felsejlett. Ahelyett, hogy az emberek manuálisan keresnének egy korlátozott link-listából, ma már algoritmusok navigálnak a hatalmas mennyiségű, egyre inkább strukturált tartalomhalmazok között, melyek egy adott lekérdezés konkrét megválaszolásához vagy az arra való reagáláshoz állnak rendelkezésre. A szemantikával, struktúrával és értelmes, gépileg értelmezhető linkekkel gazdagított adatok lehetővé teszik a számítógépek számára, hogy nagyobb pontossággal találjanak és manipuláljanak információkat a nevünkben. Ez jobb tapasztalatokat eredményez a tartalomfeltárás és keresés terén, és szélesebb körű lehetőségeket kínál az adatok zökkenőmentes megosztására, újrakombinálására, elemzésére és újrafelhasználására, kevesebb emberi és kézi interakcióval a körforgásban. A szemantikus élmények megkönnyítik az emberek számára a kreatív teljesítményt és a „súrlódásmentes” tartalmi élményekkel való találkozást, miközben egy gép végzi a valódi válaszok megtalálását, „szitálását”, rendezését, kombinálását, rendszerezését és bemutatását.

A szemantikus web története
A szemantikával, struktúrával és értelmes, gépileg értelmezhető linkekkel gazdagított adatok lehetővé teszik a számítógépek számára, hogy nagyobb pontossággal találjanak és manipuláljanak információkat a nevünkben. Ez jobb tapasztalatokat eredményez a tartalomfeltárás és keresés terén, és szélesebb körű lehetőségeket kínál az adatok zökkenőmentes megosztására, újrakombinálására, elemzésére és újrafelhasználására, kevesebb emberi és kézi interakcióval a körforgásban (Fotó: Unsplash)

A szemantikus web technológiái

A szemantikus web azonban nem csak egy ötlet volt, egy sor technológia és szabvány került kidolgozásra, hogy valósággá váljon, amit a következő pontokban mutatunkk be.

Erőforrás-leíró keretrendszer (RDF): A weben található információk ábrázolására szolgáló adatmodell. Az RDF URI-ket (Resource Description Framework, Uniform Resource Identifiers) használ az erőforrások azonosítására, és predikátumokat használ az erőforrások közötti kapcsolatok leírására.

Web Ontology Language (OWL): Kifejező nyelv az RDF-adatok jelentésének leírására. Az OWL használható az erőforrások közötti összetett kapcsolatok meghatározására és az erőforrások hierarchiába rendezett osztályainak definiálására.   

SPARQL: az RDF-adatok lekérdezési nyelve a SPARQL használható az RDF-adattárolókból való információ kinyerésére.

Szemantikus webes szolgáltatások: A webszolgáltatás egy olyan típusa, amely szemantikus jelölést használ a szolgáltatás képességeinek, valamint az általa felhasznált és előállított adatoknak a leírására.

Számos jelentős SW-fejlesztés történt, mint például a DBpedia, egyfajta Wikipedia, mely a fenti szabványokat követő strukturált információkból készült. Több mint 228 millió entitást tartalmaz, ami soknak tűnt, amikor még nem voltunk hozzászokva, hogy milliárdokról beszéljünk, mint például a Large Language Models csomópontjainak száma. A DBpedia hasonlít a Google „Knowledge Graph”-jához, melyet a keresési lekérdezések megoldására használtak (és használnak). A Google Knowledge Graph fogalmak és nevek hálózata, melyet RDF-hármasok gyűjteményeként fejeznek ki. Nem tudunk róla sokkal több információt adni, mivel ez többnyire a Google belső információjává lett mára. De biztosak lehetünk benne, hogy a Knowledge Graph nagyban hozzájárult ahhoz, hogy a Google előnyre tett szert versenytársaival szemben. Biztosan észrevették például, hogy a Google néha olyan oldalakat is előhív, ahol a kulcsszavaink nem jelennek meg, de valamilyen módon kapcsolódnak a lekérdezésünkhöz. Ez a „szemantikus keresés” miatt van. Ez a keresés túlmutat az egyszerű kulcsszavas megfeleltetésen azáltal, hogy a tudásgrafikonban szereplő, a lekérdezéssel kapcsolatos kifejezéseket is beépíti. A szemantikus keresés figyelembe veszi a szinonimákat és más fogalmi kapcsolatokat, hogy gazdagítsa a keresést. Még anélkül is, hogy az egyes technológiákat külön-külön teljesen megértenénk, láthatjuk, hogy technológiai szempontból gyakorlatilag minden darab megvolt. Akkor miért hiányzott ezúttal az „isteni szikra”? Miért tartott ilyen sokáig az szemantikus web megvalósulása?

A szemantikus web története
. Ez a keresés túlmutat az egyszerű kulcsszavas megfeleltetésen azáltal, hogy a tudásgrafikonban szereplő, a lekérdezéssel kapcsolatos kifejezéseket is beépíti. A szemantikus keresés figyelembe veszi a szinonimákat és más fogalmi kapcsolatokat, hogy gazdagítsa a keresést (Fotó: Unsplash)

A generatív mesterséges intelligencia felemelkedése

A szemantikus web abból indult ki, hogy a weben tárolt információk jelentésének megértéséhez gépileg olvasható formátumokra van szükség. Tim Berners-Lee feltételezte, hogy az ember által olvasható információ nem használhatók a gépek számára. És sokáig nem is voltak azok. Csak 2022 novemberében történt meg, hogy a ChatGPT több millió webes dokumentum „lekaparása” után képes volt megválaszolni az emberek által feltett kérdéseket, bár nem túl megbízhatóan. Aztán a dolgok gyorsan és drámaian megváltoztak. A ChatGPT és más chatbotok lenyűgöző társalgási képességei megmutatták, hogy a weben tárolt információkat a gép is „megértheti”. Továbbá képes volt kérdésekre válaszolni és megoldásokat is javasolni az embereknek. Ki gondolta volna ezt? A generatív mesterséges intelligencia gyorsan háttérbe szorította a szemantikus web-et. Képességei elvarázsolták a fejlesztőket, kutatókat és vállalatokat egyaránt. A hangsúly mára a strukturált szemantikus web létrehozásától a mesterséges intelligencia tartalomgeneráláshoz szükséges erejének kihasználására helyeződött át.

A szemantikus web története
? A generatív mesterséges intelligencia gyorsan háttérbe szorította a szemantikus web-et. Képességei elvarázsolták a fejlesztőket, kutatókat és vállalatokat egyaránt. A hangsúly mára a strukturált szemantikus web létrehozásától a mesterséges intelligencia tartalomgeneráláshoz szükséges erejének kihasználására helyeződött át (Fotó: Unsplash+)

A nagy visszatérés?

Miután bebizonyosodott, hogy a szemantikus web központi feltételezése (miszerint a gépek nem képesek megérteni a weboldalakat) tévesnek bizonyult, bizonytalanná vált a jövője is. Sokak számára úgy tűnt, hogy a szemantikus web elavulttá válik, és a kihalás útjára lép. De nem olyan gyorsan. Először is, az olyan speciális SW-technológiák, mint az RDF, a SPARQL és a szemantikus webes szolgáltatások sokáig megmaradnak, mert a meglévő infrastruktúra részét képezik. Valójában még az Amazon Web Services kínálatának részét is képezik. Emellett úgy gondolhatjuk, hogy a tudásgráfok, akár a Google-nél, akár máshol, kiegészítik majd a generatív MI megoldásokat. Sokan nem tudják, hogy a Bing hogyan használja a Knowledge Graph-ot a kérdések megválaszolására (igen, a Microsoftnak is megvan a maga verziója a Knowledge Graph-ból).  Amikor egy lekérdezést bemutatnak a Bingnek, a Knowledge Graph releváns részeinek lekérdezésére használják. Az eredmény egy olyan állításhalmazhoz hasonló, mely kiegészíti a felhasználó eredeti lekérdezését. Ezt a „feldúsított” lekérdezést ezután a ChatGPT vagy bármilyen nagy nyelvi modell kéréseként használják. Ennyi. A tudásgráfból származó információnak előnyei vannak azzal szemben, amit a chatbot nélküle csinálna: a legfontosabb, hogy megbízható információkból áll, nem pedig kitalált tényekből, hallucinációkból vagy bármilyen hamis információból, amit csak az LLM állíthat elő.

A szemantikus web története
Sokan nem tudják, hogy a Bing hogyan használja a Knowledge Graph-ot a kérdések megválaszolására (igen, a Microsoftnak is megvan a maga verziója a Knowledge Graph-ból).  Amikor egy lekérdezést bemutatnak a Bingnek, a Knowledge Graph releváns részeinek lekérdezésére használják (Fotó: Unsplash+)

Van még egy kínzó lehetőség, amiről senki sem beszél: a mesterséges intelligenciát fel lehetne használni a hagyományos weboldalak megjegyzésére és önleíróvá tételére az SW-szabványok segítségével. Tudjuk, az egyik akadály, ami lassította az SW-t, az az egyes weboldalakra való átvétel költsége volt. Sok vállalat számára a szemantikus web sosem vált prioritássá, így elkerülték, hogy erőforrásokat fordítsanak az oldalaik SW-szabványok szerinti átalakítására. Az MI segítségével azonban olcsón lehetne a weboldalakat SW-sé alakítani. Valójában az egyik feladat, melyben a chatbotok különösen jók, az a formátumok követése. A mesterséges intelligencia tehát elháríthatja az SW bevezetésének legfőbb akadályát, feltéve, hogy még mindig van érdeklődés iránta. Úgy gondolhatjuk tehát, hogy a Knowledge Graph és az SW-hez kapcsolódó technológiák közül sokan végül is hasznosak maradnak. Az irónia az, hogy a generatív mesterséges intelligencia, mely elsőre úgy tűnik, hogy az utolsó szöget üti az SW koporsójába, a végén egyfajta szimbiózisba léphet vele, és újra relevánssá teheti. Olyan alkalmazásokban működnek együtt, mint az új webes keresés a generatív MI-val, és a jövőben is folytathatják az együttműködést. Tehát a „Lesz-e visszatérés az SW számára?” kérdésre a válasz egy határozott „igen”, de nem úgy, ahogy megalkotója azt eredetileg elképzelte, azaz nem egy teljes webes átalakításként, hanem elsősorban más rendszerek támogatásaként, ami valóban már egy kevésbé fényes történet. De ugyanolyan hasznos. Lássuk be: a Tim Berners-Lee eredeti elképzelése a szemantikus webről soha, de soha nem fog megvalósulni. Ez egy zseniális ötlet volt (vagy annak tűnt), és személy szerint nem sok vállalatot győzött meg ahhoz, hogy nagy meggyőződéssel felugorjanak erre a vonatra. De a technológia nem a zseniális ötleteket, hanem mindig a kényelmeseket támogatja.

A szemantikus web története

IT EXPERTS-TECH LEADERS 2024 FELHŐ A JAVÁBÓL KONFERENCIA

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek

ICT Global News

Iratkozz fel a hírlevelünkre, hogy ne maradj le az IT legfontosabb híreiről!