Képek: Google
Okostelefonokkal készül a világon a legtöbb fénykép és videó. Ennek és a közösségi média szűrőinek ellenére a generatív szerkesztői eszközök főként desktop gépeken futnak. A mesterséges intelligenciában ezerrel pörgő Alphabet (Google) új telefonjaival, a Pixel 8 és a Pixel 8 Pro készülékekkel közelebb kerülünk az asztali gépek és kézi eszközök képszerkesztői egyenlőségéhez. A hangszerkesztési lehetőségekkel pedig még magasabbra került a léc.
Munkában a Google mérnökei
A Google kutatói hosszú ideje behatóan tanulmányozzák a képeken, videókon és hangfelvételeken javító mesterségesintelligencia-rendszereket.
Ilyenek a Google és a Georgia Technológiai Intézet közös fejlesztéseként augusztusban ismertetett, több kép egyesítésére és szegmentálására diffúziós modellt használó Best Take, a Magic Editor pedig a nagyvállalat szöveget képpé alakító diffúziós technológiája. A különféle audió- és videóanyagokat egymástól elválasztó, össze- és újrakombináló Audio Magic Editor a Google AudioScopeV2-jére emlékeztet.
Az új mobilkészülékek ezeket a fejlett gépilátás- és audiófunkciókat integrálják össze, és adják a felhasználók kezébe. Mindkét telefon rendelkezik mesterséges intelligenciával működtetett fénykép- és videószerkesztővel.
A képeket az algoritmusok a készülékben dolgozzák fel, amivel a Google alaposan feladta az okostelefon-fronton vezető, MI-fejlesztésekben viszont nem jeleskedő Apple-nek a leckét. Az „almás cégnek” ugyan vannak belső MI-projektjei, de azokról kevés és ellentmondásos infók látnak napvilágot, most viszont az egyik rivális újításával elképzelhető, hogy hamarosan lépnek majd ebben az irányban.
Mit tudnak az új készülékek?
A Best Take lehetővé teszi, hogy a felhasználó több fényképről válogasson ki és kapcsoljon egyetlen képben össze elemeket. Csoportképnél például becsukott szemeket vagy idióta grimaszokat más felvételek jobb alternatíváival cserélhetik le, amelyeken a szemek nyitva vannak, a szájakon pedig gúny helyett a mosoly az úr.
A Magic Editor képgeneráló technológiával szerkeszt vagy alakít át képeket. Egyedi elemeket mozgathatunk el, méretezhetünk át, tehetünk be előre szerkesztett háttérbe. Képkockán kívüli részeket vagy akár teljes fényképet is generálhatunk közben.
Az Audio Magic Eraser különböző hangokra osztja videók audiórészét, és például a hangon is módosíthatunk így. Ez a lehetőség különösen zavaró hangok eltüntetésére vagy beszélgetések minőségének javítására hasznos.
A Video Boost funkció később, de még 2024-ben lesz elérhető, viszont csak a Pixel 8 Pro készüléken. Jelentős mértékben javíthatunk majd vele a mozgóképanyag minőségén: automatikusan stabilizálhatjuk vele a mozgást, módosíthatunk a színeken, világításon, a kép szemcsésségén.