Generic selectors
Exact matches only
Search in title
Search in content
Post Type Selectors
post

Az Amazon kivégzi a vonalkódot

MEGOSZTÁS

Az nem meglepő, hogy robotok végzik a raktári munkát, az viszont igen, hogy a vonalkód nem segíti hatékonyan a működésüket, ezért az Amazon Robotics azon dolgozik, hogy a vonalkódok szükségtelenné váljanak, helyettük multimodális azonosítást használjanak. Az Amazon Robotics projektjében AI-alapú termékfelismerőt alkalmaznak a vonalkódok helyett.

A vonalkódot már közel 50 éve használják. Mindenütt jelen van és szinte csalhatatlan, de az Amazon számára ez már nem elég jó. Amikor egy árucikk megérkezik a logisztikai központba, az alkalmazottak vonalkódok segítségével ellenőrzik a termék azonosságát a kiszállításhoz vezető út több pontján is. Minden egyes alkalommal fel kell venni a terméket, a vonalkódot meg kell találni és be kell olvasni. Előfordul, hogy a vonalkód sérült vagy akár hiányzik is. Ez a folyamat több milliószor ismétlődik a különböző formájú és méretű termékek hatalmas kínálatában, és nem lehet egykönnyen automatizálni. Jelenleg nincs olyan robot, amelyik elég sokoldalú lenne ahhoz, hogy bármilyen raktárba érkező tárgyat áthelyezzen, majd beolvassa.

A megoldás? A vonalkód kiegészítése vagy akár kiiktatása. Vagy, ami még jobb, teljesen meg kell szünteti a kényelmetlen és nem hatékony kézi tételazonosítást.

Az Amazon éppen ezt kutatja a multimodális azonosítás (MMID – Massively Multilingual Image Dataset) segítségével. Ez a folyamat többféle információ-modalitást használ – például a tárgy megjelenésének és méreteinek kinyerését a tárgyról készült képből – az azonosítás automatizálására.

A projekt már bizonyított a hamburgi és barcelonai fulfillment logisztikai központokban, ahol a futószalagokon használják a tálcák megjelölésére, amikor az azon lévő tételek nem egyeznek meg a leltárrendszer által felsoroltakkal. Bár az ilyen eltérések ritkák, az Amazoni méretekben ezek a hibák összeadódnak.

„A víziónk, hogy ezt robotmanipuláció során használjuk” – mondja Nontas Antonakos, az Amazon berlini számítógépes látásért felelős munkacsoportjának alkalmazott tudományos vezetője, aki az MMID-csapatát vezette, amikor a koncepciót kitalálták és bevetették. „Alapvető fontosságú ennek a problémának a megoldása, hogy a robotok képesek legyenek felvenni és áthelyezni a megfelelő helyre a tárgyakat anélkül, hogy vonalkódot kellene keresniük és beolvasniuk. Segítségével gyorsabban és pontosabban juttathatjuk el a csomagokat a vásárlókhoz.”

 

Az MMID fejlesztése

A csapat egy olyan algoritmus tanításával kezdett neki a projektnek, amely egy tárgyat a hozzá tartozó fényképhez rendeli, de mivel nem volt semmilyen folyamat arra, hogy minden termékről képeket készítsenek, így ezek a képzési adatok nem álltak rendelkezésre. Az első lépés az volt, hogy egyszerűen lefényképezték a termékeket, amint azok a teljesítőközpontokban a szállítószalagokon haladnak, és így létrehoztak egy képtárat.

Ezután minden egyes képet számok leíró listájává, azaz vektorrá alakítottak, az elem méreteit szintén. A kutatók ezután gépi tanulási algoritmusokat fejlesztettek ki e vektorok kinyerésére és a jelölt elemek megfelelő vektorainak megfeleltetésére. A mélytanulás képességeit kihasználva a csapat meglepődött, hogy a kezdeti kísérletek során 75-80 százalékos találati arányt értek el, amely a K+F-projekt mostani szakaszára 99 százalék közeli találati arányokat érnek el az MMID segítségével.

Ezek a magas találati arányok részben annak köszönhetőek, hogy az Amazon leltárrendszerei, a teljesítési folyamat minden egyes lépésénél pontosan tudják, hogy az egyes tételek hol vannak. Az algoritmusnak nem kell összevetnie egy terméket az több százmillió termékből álló teljes termékkínálattal – ami jelenleg lehetetlen feladat. Minden egyes tétel egy adott tárolóedényből származik, és minden egyes tálca csupán néhány tucat terméket tartalmaz. Az algoritmusnak tehát csak egyetlen szállítóedény tartalmával kell összevetnie egy terméket.

Az MMID-technológiát először a lengyelországi Szczecinben, a logisztikai teljesítési központban próbálták ki, ahol egy kamera egy futószalag fölött helyezkedett el, amely szingulált tálcákat – olyan tálcákat, amelyek csak egy terméket tartalmaznak – fényképezett. Az egyesített tálcák azért ideálisak, mert könnyebb azonosítani egyetlen tételt, mint több tételt szétválasztani, majd megpróbálni azonosítani mindegyiket.

Ráadásul az egyesített tálcák elég korán megjelennek a teljesítési folyamat során ahhoz, hogy elkerüljük azt az esetet, amikor a tételek egészen a folyamat végéig eljutnak, és valakinek akkor kell foglalkoznia a hibával” – mondja Doug Morrison, a Robotics AI alkalmazott tudósa, aki az elmúlt két évben mélyen elmerült a projektben. „Ilyenkor egyszerűen visszavezethetők a hibás tételt a rendszerbe a megfelelő helyre.”

A tanulási folyamat alapvető fontosságú. Az MMID kezdeti bevezetése például váratlan kihívással szembesítette a projektben résztvevők, ami részben a Prime Day promóciónak volt köszönhető, amikor is óánként több száz Echo Dot hangszóró hagyta el a logisztikai központot, két színben: szürke és kék, viszont ezeket az algoritmus nem tudta megkülönböztetni.

„A vonalkódot leszámítva – amely nem volt látható –, a csomagolás szinte teljesen azonos, csupán egy apró kép állt rendelkezésére a robotnak, egy kék és egy szürke pontról, ekkor a rendszerünk összezavarodott.” Ez vezetett egy új és fontos funkcióhoz, a megfelelési pontszámhoz, amely a termék összes azonosítási pontján megjelenik. Ha ez magas, akkor átengedi a tálcát az ellenőrzőponton, ha alacsony, akkor nem biztos a rendszer a termék azonosításában és nem tesz semmit.

PODCAST

ICT Global News

VIDEOGALÉRIA
FOTÓGALÉRIA

Legnépszerűbb cikkek