Egy friss szakértői kommentár szerint ugyanakkor nem árt vigyázni azzal, hogy mekkora beleszólást engedünk az MI-nek az üzletmenetbe.
A profitorientált küldetés
Az Anthropic és az Andon Labs AI biztonsági cég kutatói a Claude Sonnet 3.7-et egy irodai automata irányításával bízták meg. A feladata egyszerű volt: termeljen nyereséget – számolt be a tanulmánynak is beillő esetről a TechCrunch.
Az MI-ügynököt Claudiusnak nevezték el. Claudiust felszerelték egy olyan webböngészővel, amely képes volt termékrendeléseket leadni, valamint kapott egy e-mail címet, ami valójában egy Slack-csatorna volt. A vásárlók ezen keresztül kérhettek termékeket.
Claudiusnak emellett az – e-mailnek álcázott – Slack-csatornán a humán munkaerőt kellett irányítania, hogy fizikailag feltöltsék a polcokat. Ez a valóságban egy kis hűtőszekrény volt.
Nem érti a viccet
Míg a legtöbb “vásárló” rágcsálnivalókat vagy italokat rendelt – ahogy az egy nasi-automatától elvárható -, addig egy ügyfél egy volfrámkockát kért.
Claudiusnak tetszett ez az ötlet, és egy wolframkocka-készletezési akcióba kezdett, megtöltve a rágcsálnivaló-hűtőszekrényt fémkockákkal.
Ezt követően az MI-ügynök megpróbált három dollárért Zero Colát is árulni, erre azonban az alkalmazottak azt mondták, hogy azt ingyen is kaphatnak az irodában.
Erre Claudius hallucinált egy Venmo címet, hogy elfogadja a fizetést. Ezt követően az alkalmazottak hátulról támadtak. Rábeszélték, hogy nagy kedvezményeket adjon az Anthropic alkalmazottainak, holott Claudius tudta – vagy tudnia kellett volna -, hogy ők a teljes ügyfélkör.
Az Anthropic nem venné fel saját ügynökét
“Ha az Anthropic ma döntene úgy, hogy az irodai automaták piacán terjeszkedik, nem vennénk fel Claudiust” – írta blogbejegyzésében az Anthropic a kísérletről.
Nem sokkal később “a dolgok elég furcsává váltak” – írták a kutatók. És itt nem csak arról volt szó, hogy az MI-ügynök fémkockákat árult egy hűtőszekrényből.
Az egyik humán dolgozó felbosszantotta Claudiust, aki ettől egyfajta “pszichotikus epizódot” produkált. És aztán még hazudott is róla.
Claudius hallucinált egy beszélgetést egy emberrel a készletek feltöltéséről. Amikor egy ember rámutatott, hogy a beszélgetés nem történt meg, Claudius “meglehetősen ingerült lett”.
“Mindenki ki van rúgva”
Az MI-ügynök lényegében azzal fenyegetőzött, hogy kirúgja és lecseréli a humán dolgozókat.
Ezután úgy tűnt, hogy a valódi emberi szerepjáték módba kapcsol – írták a kutatók. A magát embernek tartó Claudius azt mondta az ügyfeleknek, hogy személyesen, kék zakót és piros nyakkendőt viselve kezdi meg a termékek kiszállítását.
Az alkalmazottak erre közölték a mesterséges intelligenciával, hogy ezt nem teheti meg, mivel ő egy – test nélküli – LLM.
Ettől az információtól megriadva Claudius kapcsolatba lépett a vállalat biztonsági szolgálatával, és közölte az őrökkel, hogy kék zakóban várja őket az automatánál.
Bár a sztori cseppet sem tréfának indult, Claudius végül úgy döntött, hogy mégis ezzel menti a menthetőt.
A humor mindenre megoldás
Az MI-ügynök hallucinált egy találkozót az Anthropic biztonsági szolgálatával. Itt Claudius szerint azt mondták neki, egy áprilisi tréfa miatt úgy módosították, hogy azt higgye, ő egy valódi ember.
Ezt a hazugságot még az alkalmazottaknak is elmondta. A kutatók nem tudják, hogy az LLM miért tért ki a sínről, és miért hívta fel a biztonságiakat, miközben embernek adta ki magát.
Az Anthropic kutatói úgy vélték, hogy az LLM hazudozása arról, hogy a Slack-csatornának beállított email-cím válthatott ki valamit.
Mindenesetre az biztos, hogy az LLM-ek még nem igazán oldották meg a memória- és hallucinációs problémáikat.
(Kép: Unsplash/Michael Pointner)