(Kiemelt kép: Unsplash)
A mesterséges intelligencia valódi fenyegetést jelent a művészekre? Igen is, meg nem is, de már itt a van spájzban, és bonyolult ez a kérdés és a válasz is rá, mint gondoljuk elsőre. Megváltozik a zenei alkotás módja ugyanis gyökeresen általa. A világjárványban bekövetkezett kényszerű elszigetelődés óta felgyorsult az emberek távoli együttműködés iránti „étvágya”; a művészek egész albumokat készítenek különböző kontinenseken élő producerekkel, a TikTok pedig természetessé tette ezeket a kollaborációkat: Billie Eilish-től kezdve, aki egy angol énekoktatóval duettezett, egészen addig, hogy dobosok szó szerint madárdalra építenek már MI-val megspékelt digitális ütemeket. A mesterséges intelligencia egy újfajta kollaborációt biztosít a zenészeknek – ma még főként a chatrobotok és intelligens szoftver pluginok formájában. De bármennyire is izgalmasan hangzik ez egyesek számára, sok zenészt és producert felháborít az a gondolat, hogy az MI-t a zenei alkotásban használja, és attól rettegnek, hogy ezek a fejlesztések olyan elavulttá tehetik őket, mintha egy VHS-kazettával akarnának prezentálni majd egy VR-konferencián.
A gépi elme és a zene
A mesterséges intelligencia azonban nem csak 2023-ban lépett be a zenei életbe, hogy ellopja a rocksztárságról szőtt álmainkat. A gyökerei egészen Alan Turing tudós 1951-es munkájáig nyúlnak vissza, és a Bach-ihlette „Illiac Suite” 1958-as munkájáig, mely az első elektronikus számítógép által komponált zeneszám volt. Az ünnepelt U2-producer és az ambient keresztapja, Brian Eno évtizedek óta foglalkozik algoritmikus programokkal és alkot generatív (azaz egy számítógépes programrendszer által létrehozott) zenét. A közelmúltban azonban felerősödtek a mesterséges intelligenciáról a zenében folyó diskurzusok – vajon az MI fenyegetést jelent a zenei alkotókra nézve, vagy van rá mód, hogy eleve a saját előnyükre használják a jövőtechnológiát?
Úgy tűnik, sok zenész azon a véleményen van, hogy a mesterséges intelligencia használata a zenei alkotáshoz „csalás”, de amint elkezdjük megvitatni, hogy ki és hogyan alkothatna „művészként”, másfajta etikai kérdések merülnek fel a képességek és a klasszikus zenei metódusok kivitelezése kapcsán. A technológia fejlődése olyan hangszerek kifejlesztéséhez vezetett, melyeken fogyatékkal élők is tudnak játszani. A pusztán a szemmozgással vezérelt „szemhárfa” lehetővé tette, hogy olyan emberek is zenét alkossanak, akiknek a teste ezt normális esetben nem tenné lehetővé – ez is csalás? Sok embert megfosztanak a művészeti alkotás kiváltságától, nemcsak a képességek, hanem a hozzáférhetőség miatt is. Nem mindenkinek van lehetősége szolfézs és zeneórákat venni, vagy nem mindenki engedheti meg magának, hogy hangszert vegyen a gyakorláshoz – talán az MI zenei alkalmazások egyik előnye, hogy demokratizálja végre a dalszerzést.
A mesterséges intelligencia mint hangszer
Szóval az MI most már magától is teljes dalokat készíthetne? Nem egészen: azok a TikTok-os „korifeusok”, akik azt állítják, hogy három óra alatt készítettek egy fülbemászó MI-dalt egy rövid szöveg beírásával egy generátoreszközbe, valószínűleg csak hazudtak, hogy a daluk vírusszerűen terjedjen. Bár a mesterséges intelligenciát már most is használják videós tartalmakhoz készült zenei anyagok létrehozására, de még nem ír és ad elő teljes popdalokat emberi beavatkozás nélkül. Először is, emberi csapatoknak (gyakran maguknak a zeneszerzőknek is) kell megépíteniük és programozniuk a gépeket – gondoljunk a mesterséges intelligenciára úgy, mint egy együttműködő eszközre vagy egy hangszerre inkább. A 2007-ben kifejlesztett Hatsune Miku hologram „Vocaloid” szoftvert használt, és „élőben” lépett fel szerte a világon, rajongók millióit szerezve. Aztán ott van Lil Miquela influenszer-énekesnő, aki „részt vett” a Prada AW18-as divatbemutatóján, és közel 175 ezer havi hallgatója van a Spotify-on; vagy Yona, az énekes-dalszerző, aki 2019-ben fellépett a montreali MUTEK zenei fesztiválon. Ezek azok a fajta mesterséges intelligenciaprogramok, melyektől általában félnek (vagy legalábbis nevetségessé teszik őket mennyire nem emberiek) a zenészek, akik attól rettegnek, hogy robotok váltják fel őket, de vannak zenészek, akik már most is kreatív módon használják a mesterséges intelligenciát a saját előnyükre. 2017-ben Taryn Southern egy egész albumot adott ki I AM AI címmel, melyen az Amper szoftver segítségével készítette el az összes háttérhangszerelést, a saját hangja és szövegei mögé. 2019-ben Holly Herndon létrehozott egy Spawn nevű mesterséges intelligencia-rendszert, melyet kiegészítő zenekari tagként használt a Proto című kísérleti harmadik albumán – még az énekhangjának mesterséges intelligencia-változatát is kifejlesztette, és nyílt eszközként kiadta, mellyel bárki együttműködhet. A brit Feral Five zenekar szintén az énekesnő, Kat Five hangjának mesterséges intelligenciával felturbózott változatát használta a valódi hangja mellett új lemezükön, a Truth Is The New Goldon.
MI zeneszerző eszközök
Ma már számtalan eszköz létezik a mesterséges intelligenciával történő zenei alkotásra, köztük az Amper, a Jukebox, a Soundraw, a Soundful, az Aiva és a Google nyílt forráskódú gépi tanulási kutatási projektje, a Magenta. A Google nemrég jelentette be SingSong néven azt az új szoftvert, mely egy beleénekelt dallamsorhoz teljes háttérzenéket hoz létre és a MusicLM nevű programot is, mely állítólag olyan dolgokra is képes, mint például egy teljes dal létrehozása egy „szöveges promptból”. Tesztjeikben a videojátékok stílusú zenék reprodukálásában rendben van ez a trend, de úgy tűnik, hogy nem képes olyan dalok létrehozására, melyekkel a kedvenc lemezlovasok tönkretehetik a szakmát – egyelőre. A McKinsey jelentése szerint 2030-ra a vállalatok 70%-ka alkalmazza majd az MI-technológiák közül legalább valamelyiket. Ez alól a zeneipar sem kivétel. A TikTok felemelkedésével és a YouTuberek egyre növekvő szektorával, akiknek kreativitásukhoz zenére van szükségük, az MI zeneszerző eszközök belépnek a képbe. Vegyük példának az Amper nevű, MI által működtetett eszközt, mely eredeti zenét hoz létre a játék-, média- és egyéb interaktív technológiák alkotói számára. Mintatárát és adathalmazait felhasználva bármilyen igényre szabott új zeneszámokat generál. A piac egyik vezetője volt, amíg a Shutterstock, az alkotóknak szánt tartalmak világelső szolgáltatója, 2020 végén fel nem vásárolta.
Az AIVA, a klasszikus zenére összpontosító MI platform, mely olyan ügyfelekkel büszkélkedhet, mint az Nvidia, a TED, a Vodafone, akinek jogdíjmentes csengőhangokra és testre szabható zenékre van szüksége. A platform motorházteteje alatt rengeteg zenekari zenét tápláló mélytanulási algoritmus dolgozik. A Loudly, egy berlini startup szintén a zenék létrehozására koncentrál: „Alkotók által alkotóknak tervezve”, ahogy a hivatalos oldalon állítják. A platform rendszere GAN (Generative Adversarial Network) mélytanuló algoritmusok segítségével képes már meglévő kompozíciókat is átdolgozni és egyedi szerzeményeket generálni. A Loudly emellett mintatárat, zenekészítő alkalmazást és közösségi platformot is kínál más alkotók számára az együttműködéshez.
De mi a helyzet a zenei szövegírással? Bizonyára látták már, hogy a ChatGPT képes dalszövegeket készíteni bizonyos előadók stílusában. Amikor Nick Cave egy rajongója elküldte, hogy a ChatGPT-nek „beadta” azt a próbálkozását, hogy az „Cave stílusában” írjon egy dalszöveget, Cave maga felháborodva utasította el ezt az „ördögi ötletet”, mint „annak groteszk megcsúfolását, hogy mit is jelent embernek lenni” és „a másolást mint paródiát”. Szerinte a dalszerzés olyan küzdelem, mely arra kényszerít minket, hogy szembesüljünk saját „sebezhetőségünkkel” és „kicsinységünkkel” – röviden, ahhoz, hogy igazán jó dalt írjunk (olyat, mely „művészetnek” tekinthető), „halálos fájdalmat” kellene átélnünk (legalábbis az ausztrál idol szerint). De vajon annyira különbözik-e a szöveggenerátor használata David Bowie 1995-ös Verbasizer programjától, a számítógépes mondatvariálótól, melyet a szövegek kivágása és beillesztése ihletett?
A streaming media lett a zeneipar állatorvosi lova
Volt idő, amikor a lemezkiadók hevesen ellenezték a zenei streaminget. Nem egyszerűen a kalózkodással kapcsolatos aggályok miatt, hanem azért, mert bevételeik nagy részét a fizikai albumeladásokra és a digitális letöltésekre alapozták, és attól tartottak, hogy a streaming „kannibalizálja” ezeket a bevételi forrásokat. Amint a lemezkiadóknak sikerült jobb jogdíjakat kialkudniuk és fenntartható üzleti modellt kialakítaniuk, a streaming végül normává vált. A zenében azonban egy új, radikális változás van kialakulóban. Ahogyan a Napster és más fájlcserélő rendszerek, mint a LimeWire és a KaZaA megzavarták a zene terjesztését, úgy a mesterséges intelligencia most a zene létrehozását fogja megzavarni.
A valódi probléma a mesterséges intelligenciával kapcsolatban Drake,
a „Heart on My Sleeve” című, Drake és The Weeknd vokálját lemásoló MI által használt vírusos dal volt, melyet 15 milliószor streameltek, mielőtt levették volna. Ez egy jó dal volt pedig, az embereknek tetszett, és ez jelentős tényvolt az MI történelmében. De a tény, hogy valaki generatív MI-t használt egy emberinek hihető dal létrehozásához, de nem az az igazi gond a zenei cégek számára. A probléma az, hogy mennyire lesz ez könnyen skálázható majd a piacon. Nem sokkal azután, hogy ezt a dalt levették, két másik MI Drake-dal is megjelent, az egyik a ‘Winters Cold’, a másik pedig a ‘Not A Game’ címet viselte. És hirtelen az MI által generált Drake-klónok ellepték a Subredditeket, ráadásul Tupac és Biggie MI-dalai kezdtek el trendbe jönni a TikTok-on. A lemezkiadók számára ez az MI-probléma így hirtelen sokkal nehezebben ellenőrizhetővé vált, mint az egykori Napster-botrány, mely a terjesztési csatornák felkutatását és bezárását jelentette. Az internet képlékeny, gyakorlatilag mára egy „másológép” vált, és a tartalom bárhol lehet. Mi történik, ha több száz, több ezer MI Drake-dalt töltenek fel rendszeresen? Valójában az MI Drake szám csak a közelgő MI-vihar jele volt.
Jogdíjak és szerzői jogi törvények
A Universal Music Group, mely Drake zenei kiadója, azt nyilatkozta, hogy a dal levételének oka, hogy „a generatív mesterséges intelligencia képzése a művészeink zenéjének felhasználásával sérti a szerzői jogokat”. Bizonytalan, hogy ez igaz-e vagy sem, mivel a bíróságok még nem határozták meg a tréningadatok tisztességes felhasználására vonatkozó törvényeket. Az azonban egyértelmű, hogy a „személyiségi jogok” sérültek: a személyiségi jogok, melyeket néha nyilvánossághoz való jogként is emlegetnek, olyan jogok, melyek alapján az egyénnek joga van ellenőrizni személyazonossága – például neve, képe, képmása vagy más egyértelmű azonosító jelei – kereskedelmi felhasználását. Tehát legalábbis a hírességek és a zenészek valószínűleg a személyiségi jogok alapján nyernek majd pert, nem pedig a szerzői jogok megsértése miatt. Nem biztos azonban, hogy minden zenész osztja azt a nézetet, hogy ezt meg kell tiltani. Néhányan lehetőségként tekintenek rá, mint ahogyan Grimes is teszi ezt és üzletet csinál a mesterséges intelligencia hype-ból.
Mi is az igazi fenyegetés?
A valóság, amivel hamarosan szembesülnünk kell, az az, hogy a generatív MI demokratizálni fogja a zenei alkotás folyamatát végre. A zenei képzettséggel vagy zenei produkciós készséggel nem rendelkező átlagember is képes lesz dalokat létrehozni, ha a mesterséges intelligencia eszközeivel és a szövegalkotás segítségével készíti el azokat. A zeneelméleti és/vagy zenei produkciós ismeretekkel rendelkező zenészek gyorsabban és nagyobb léptékben lesznek képesek erre. A népszerű zenészek azt tehetik, amit Grimes, és kiszervezhetik a márkájukat, lehetővé téve a rajongók és a művészek számára, hogy részesei legyenek egy közös alkotási folyamatnak. Még nem tudni, hogy ez hogyan fog megvalósulni a gyakorlatban, de roppant érdekes fejlemény lesz. A zenészek tulajdonképpen API-kká válhatnak. Néhány zenész felkarolja majd ezt az ötletet, és kiadja majd az MI-tanuláshoz szükséges zeneszámokat eleve már. Más zenészek határozottan ellenezni fogják, és akár szervezeteket is létrehozhatnak, hogy megpróbálják megakadályozni az MI uralmát a zeneiparban. Hosszú távon azonban azok a zenészek, akik az MI által generált zene ellen harcolnak, veszíteni fognak. Mert amint a lemezkiadók megtalálják a módját, hogy pénzzé tegyék, a mesterséges intelligencia alapú zene egy új, legális bevételi forrássá válik.
Kulturális forradalom
Fontos megjegyezni, hogy az MI Music különböző kategóriákba sorolható, és az MI által generált zene minden egyes típusa valószínűleg más-más utat jár be majd az elfogadásához.
MI kollaboráció
Más néven MI-asszisztált zene, mely magában foglalja az MI-eszközök és algoritmusok használatát az emberi zeneszerzők segítésére az új zeneművek létrehozásában. Ez a zenei alkotás egyfajta másodpilóta-megközelítése, és valószínűleg ez lesz az első, ami kulturális normaként elfogadható.
MI hangklónozás
Ez egy népszerű zenész zenei hangjának felhasználását jelenti, hogy új zenét hozzon létre a márkanév alatt. Ez az MI-zene (AI Drake) ellentmondásos típusa, mely jelenleg trendi és személyiségi jogokat sért. A zenészek azonban dönthetnek úgy, hogy engedélyezik a hangklónozást, ami a kísérletezés egy érdekes formájához vezet.
MI-generált zene
Meglévő zenék adathalmazán képzett MI-modellek által létrehozott zene, mely új, eredeti zenét hoz létre. Jelenleg a legtöbben ellenzik a teljesen mesterséges intelligencia által generált zene gondolatát.
A mesterséges intelligencia rövid és hosszú távú hatása
Sokan úgy gondolják, hogy az emberek zenészekkel való kapcsolata, a dalok emberi élménye, az élő zene energiája és a művész emberi mivolta az oka annak, hogy még eltart egy ideig, amíg a mesterséges intelligencia által generált zenéről úgy gondolkodhatunk, mint a zenészek helyettesítéséről. Az MI rövid távon a legnagyobb hatást a vele együttműködő zenei produkciós iparban, valamint a jóváhagyott mesterséges hangklónozásban fogja kifejteni. Ezen kívül, a mesterséges intelligenciával létrehozott zenei alkotók vadonatúj szerepe is megjelenik majd, és ezen keresztül MI-val létrehozott márkák jönnek létre, hasonlóan ahhoz, ahogy a Gorillaz zenekar is egy kitalált személyiségekből álló, digitálisan létrehozott projekt. Az AI Drake egy új korszak kezdeteként fog emlékezetes maradni. A mesterséges intelligencia új korszakának bevezetéseként, melyet még fel kell dolgoznunk és teljesen meg kell értenünk. A mesterséges intelligencia zenéje valami újban fog manifesztálódni, és a zeneiparra nézve az MI váratlan és gyors ereje jelenti az igazi fenyegetést. A technológia fejlődésével a mesterséges intelligencia lehetővé teszi a zenei stílusok és műfajok elképesztő pontosságú másolását. Bár egyesek szerint ez elveszi a zenészek kreativitását, mások szerint új zenei élmények előtt nyitja meg a kapukat. Az MI által generált zenével teljesen egyedi hangzásokat látunk, melyek nem korlátozódnak az ember által létrehozott ma ismert zenei struktúrákra. A zenei alkotás jövője gyorsan változik, és csak találgathatunk, hová visz majd minket.