Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Podcasterek hangját klónozza és fordítja le MI-vel a Spotify

Az OpenAI új hangtechnológiájának köszönhetően a Spotify az eredeti hanggal fordít podcasteket. Lehet a főszereplő angol anyanyelvű, ha spanyolul akarjuk hallgatni, ugyanúgy változtatás nélkül halljuk – csak már egy másik nyelven.

Képek: Flickr, Pxfuel

 

A hangklónozást évek óta – leglátványosabban csalásra, zsarolásre – használják, a mai minőség viszont egy napon sem említhető a kezdetekével. Sajnos a fakenews iparban, a dezinformáció terjesztésében is meghatározó szerephez jutott.

A mesterséges intelligencia (MI) egyik legújabb praktikus alkalmazása a Spotify új eszköze, amellyel egy podcast úgy fordítható le több nyelvre, hogy maradnak az eredeti műsorban hallható hangok. Az új funkciót az OpenAI nemrég bevezetett hanggeneráló technológiája tette lehetővé. Néhány másodperc hallgatás után máris remekül utánozható, klónozható vele bármilyen hang.

 

Az OpenAI megint újított

Tehát a ChatGPT a szöveg után, a szintén új vizuális képességek mellett, hanggal is bővült; új interfésze sokkal intuitívebb, mint az eddigi: immár hangalapú beszélgetést is folytathatunk vele, illetve meg is mutathatjuk neki, hogy éppen miről beszélünk.

Képzeljünk el: úton vagyunk, lövünk egy fényképet a tájról, aztán élőszóban elcsevegünk róla a ChatGPT-vel. Otthon meg, miután a jégszekrényből kivettük, és lefényképeztük a húst és a zöldségeket, megkérdezhetjük tőle, hogy mit főzzünk belőlük. El fogja mondani. Vacsora után, a gyereknek segítve, lefotózunk egy matematikai problémát, és kedvenc chatbotunk rögvest élőhangon világosít fel róla.

 

 

Az új hangopciót szöveget beszéddé (text-to-speech) alakító új modell teszi lehetővé. Szövegből vagy néhány másodperc hangmintából emberszerű audióanyagot generál. A fejlesztők profi hang- és szinkronszínészekkel együtt dolgoztak rajta. A szintén OpenAI fejlesztés Whisper nyíltforrású beszédfelismerő rendszer is besegíthet: szöveggé írja át a beszélt nyelven elmondott szavakat.

 

Podcast másként, mint eddig

A Spotify elmondta, hogy az új eszközzel autentikusabbá válik a műsorhallgatás élménye. Ezek a hangok személyesebbek és természetesebbek, mint a hagyományos szinkronizálás. Képzeljük el: az eredetileg angol nyelvű podcast most már más nyelveken is elérhető, a megszólalók, szereplők pedig pont úgy beszélnek, ahogy az eredetiek, még az egyedi hangtulajdonságaik is teljesen megegyeznek.

Kérdés, hogy hosszabbtávon mennyire eredményesen sikerül visszaadni az eredeti párbeszéd nüánszait. És persze újabb pofon a szinkronszínészeknek, mert a technológia könnyen átültethető televíziós képernyőre, filmvászonra – például játékfilmek teljes hanganyaggal.

A Spotify angol-spanyollal kezdte, de pár nappal később már a francia és a német is elérhető volt. Az alkalmazás „hangfordítás” központjában mindig megnézhetjük az adott pillanatban elérhető lefordított műsorok listáját, mellé a következő hetekben érkezőkét is.

A Spotify közölte, hogy a platformon kb. százmillió felhasználó hallgat rendszeresen podcastet. Az MI-alapú megoldás többmilliós hallgatást hozhat egyes műsoroknak, amelyek hirtelen új, korábban elképzelhetetlen méretű piacon találják magukat.

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek

ICT Global News

Iratkozz fel a hírlevelünkre, hogy ne maradj le az IT legfontosabb híreiről!