Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Generatív MI a Google új telefonjain

MEGOSZTÁS

Komoly eredményt ért el a Google az okostelefonok mesterségesintelligencia-használatában. Két új készüléke hasonló MI kép-, videó- és audiószerkesztési lehetőségekkel rendelkezik, mint az az asztali számítógépek. Vajon mit lép erre az Apple?

Képek: Google

 

Okostelefonokkal készül a világon a legtöbb fénykép és videó. Ennek és a közösségi média szűrőinek ellenére a generatív szerkesztői eszközök főként desktop gépeken futnak. A mesterséges intelligenciában ezerrel pörgő Alphabet (Google) új telefonjaival, a Pixel 8 és a Pixel 8 Pro készülékekkel közelebb kerülünk az asztali gépek és kézi eszközök képszerkesztői egyenlőségéhez. A hangszerkesztési lehetőségekkel pedig még magasabbra került a léc.

 

Munkában a Google mérnökei

A Google kutatói hosszú ideje behatóan tanulmányozzák a képeken, videókon és hangfelvételeken javító mesterségesintelligencia-rendszereket.

Ilyenek a Google és a Georgia Technológiai Intézet közös fejlesztéseként augusztusban ismertetett, több kép egyesítésére és szegmentálására diffúziós modellt használó Best Take, a Magic Editor pedig a nagyvállalat szöveget képpé alakító diffúziós technológiája. A különféle audió- és videóanyagokat egymástól elválasztó, össze- és újrakombináló Audio Magic Editor a Google AudioScopeV2-jére emlékeztet.

 

 

Az új mobilkészülékek ezeket a fejlett gépilátás- és audiófunkciókat integrálják össze, és adják a felhasználók kezébe. Mindkét telefon rendelkezik mesterséges intelligenciával működtetett fénykép- és videószerkesztővel.

 

A képeket az algoritmusok a készülékben dolgozzák fel, amivel a Google alaposan feladta az okostelefon-fronton vezető, MI-fejlesztésekben viszont nem jeleskedő Apple-nek a leckét. Az „almás cégnek” ugyan vannak belső MI-projektjei, de azokról kevés és ellentmondásos infók látnak napvilágot, most viszont az egyik rivális újításával elképzelhető, hogy hamarosan lépnek majd ebben az irányban.

 

Mit tudnak az új készülékek?

A Best Take lehetővé teszi, hogy a felhasználó több fényképről válogasson ki és kapcsoljon egyetlen képben össze elemeket. Csoportképnél például becsukott szemeket vagy idióta grimaszokat más felvételek jobb alternatíváival cserélhetik le, amelyeken a szemek nyitva vannak, a szájakon pedig gúny helyett a mosoly az úr.

 

 

A Magic Editor képgeneráló technológiával szerkeszt vagy alakít át képeket. Egyedi elemeket mozgathatunk el, méretezhetünk át, tehetünk be előre szerkesztett háttérbe. Képkockán kívüli részeket vagy akár teljes fényképet is generálhatunk közben.

Az Audio Magic Eraser különböző hangokra osztja videók audiórészét, és például a hangon is módosíthatunk így. Ez a lehetőség különösen zavaró hangok eltüntetésére vagy beszélgetések minőségének javítására hasznos.

A Video Boost funkció később, de még 2024-ben lesz elérhető, viszont csak a Pixel 8 Pro készüléken. Jelentős mértékben javíthatunk majd vele a mozgóképanyag minőségén: automatikusan stabilizálhatjuk vele a mozgást, módosíthatunk a színeken, világításon, a kép szemcsésségén.

IT EXPERTS-TECH LEADERS 2024 FELHŐ A JAVÁBÓL KONFERENCIA

PODCAST

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek

ICT Global News

Iratkozz fel a hírlevelünkre, hogy ne maradj le az IT legfontosabb híreiről!