www.magyar-mernoki.com
16
'19
Written on Modified on
Cognex Germany Inc
Mélytanulás + gépi látás = a felügyeleti rendszerek következő generációja
A gépi látás és a mélytanulás kombinációja erős alapot ad a vállalatoknak mind az operatív működés, mind a befektetésarányos megtérülés vonatkozásában. A beruházások megtérülésének maximalizálása szempontjából elengedhetetlen tehát a hagyományos gépi látás és a mélytanulás közötti különbségek felkutatása, valamint annak megértése, hogy ezek a technológiák kiegészítik egymást – nem pedig versenyeznek egymással, vagy helyettesítik egymást. Jelen cikk ezt a kérdéskört hivatott tisztázni.
Az elmúlt évtizedben a technológia változásai és fejlesztései sokrétűek voltak: eszközmobilitás… big data… mesterséges intelligencia (AI)… A Dolgok Internete… robotika… blokklánc… 3D nyomtatás… gépi látás… Mindezek az újdonságok azért kerültek ki a K+F laboratóriumokból, hogy mindennapi életünket javítsák.
A mérnökök szeretik a technológiákat alkalmazni és adaptálni azokat az ipari környezetekhez és korlátokhoz. Ezen technológiák egy részének vagy mindegyikének átvételére és kihasználására vonatkozó stratégiai tervezés kulcsfontosságúvá vált a feldolgozóiparban.
Fókuszáljunk most a mesterséges intelligenciára és a mélytanulásra épülő képanalízisre vagy a példákon alapuló gépi látásra. A hagyományos, szabályalapú gépi látásmóddal kombinálva az AI segíthet a robotizált összeszerelő egységeknek a megfelelő alkatrészek azonosításában, felismerheti, hogy egy alkatrész hiányzik-e, vagy nem megfelelően van-e felszerelve a termékre, és gyorsabban meghatározhatja, hogy ezek problémát jelentenek-e. Mindezt rendkívül nagy pontossággal.
Először nézzük meg, mi a mélytanulás
Anélkül, hogy túlságosan belemennénk a részletekbe, beszéljünk a GPU hardverről. A GPU-k (grafikus feldolgozó egységek) ezernyi viszonylag egyszerű feldolgozó magot gyűjtenek össze egyetlen chipbe. Felépítésük az ideghálózatokhoz hasonlít. Lehetővé teszik a biológiai ihletésű és többrétegű «mély» ideghálózatok telepítését, amelyek az emberi agyat utánozzák.
Egy ilyen architektúra alkalmazásával a mélytanulás lehetővé teszi konkrét feladatok megoldását anélkül, hogy kifejezetten arra programozták volna. Más szavakkal: a klasszikus számítógépes alkalmazásokat az emberek úgy programozzák, hogy azok „feladat-specifikusak” legyenek, míg a mélytanulás adatokat (képeket, beszédeket, szövegeket, számokat stb.) használ és idegi hálózatokon keresztül képezi le azokat. Az alapképzés során kifejlesztett elsődleges logikától kezdve a mély idegi hálózatok folyamatosan finomítják teljesítményüket, amint új adatokat kapnak.
Ez a koncepció a különbségek felismerésén alapszik: tartósan vizsgálja az adatkészlet változásait és szabálytalanságait. Érzékeny és reagál a kiszámíthatatlan hibákra. Az emberek minderre evolúciós okokból kiválóak. A merev programozáson alapuló számítógépes rendszerek azonban nem jók ebben (de a gyártósorok emberi ellenőreivel ellentétben a számítógépek nem fáradnak el, ha állandóan ugyanazt az iterációt végzik).
A mindennapi életben a mélytanulás tipikus alkalmazásai az arcfelismerés (a számítógépek feloldásához vagy az emberek fotókon történő azonosításához)… ajánlási motorok (a videó- és zeneszolgáltatások közvetítéséhez vagy az e-kereskedelemhez)… spamszűrés e-mailekben… betegségdiagnosztika… hitelkártya csalások felderítése…
A mélytanulás technológiája nagyon pontos eredményeket ad a képzett adatok alapján. Használják a minták előrejelzésére, a varianciák és rendellenességek észlelésére, valamint a kritikus üzleti döntések meghozatalára. Ugyanez a technológia mostantól a fejlett gyártási gyakorlatokban jelenik meg a minőség-ellenőrzés és az egyéb, döntéshozatalon alapuló alkalmazások esetében.
A megfelelő típusú gyári környezetben történő alkalmazás esetén, a gépi látáshoz kapcsolódóan, a mélytanulás növeli a gyártás nyereségességét (különösen más feltörekvő technológiákba történő beruházásokkal összehasonlítva, amelyeknél éveket vehet igénybe a megtérülés).
Hogyan egészíti ki a mélytanulás a gépi látást?
A gépi látórendszer egy digitális érzékelőn alapul, amelyet egy speciális optikával ellátott ipari kamerába helyeznek. A rendszer képeket készít, amelyeket egy számítógépre továbbítanak. A döntéshozatalhoz a specializált szoftverfolyamatok elemzéseket készítenek és különféle jellemzőket mérnek. A gépi látásrendszerek megbízhatóan teljesítenek a következetesen és megfelelően gyártott alkatrészek esetében. Lépésről lépésre történő szűréssel és szabályalapú algoritmusokkal működnek.
Egy gyártósoron a szabályokon alapuló gépi látórendszer percenként száz vagy akár több ezer alkatrészt is ellenőrizhet nagy pontossággal. Költséghatékonyabb, mint az emberi ellenőrzés. A vizuális adatok kimenete programozási, szabályalapú megközelítésen alapul az ellenőrzési problémák megoldására.
A gyártóterülethez a hagyományos, szabályokon alapuló gépi látás az ideális: irányításhoz (pozícionálás, tájolás…), azonosításhoz (vonalkódok, datmátrix kódok, jelek, karakterek…), méréshez (a távolságok a megadott értékekkel történő összehasonlítása…), ellenőrzéshez (hibák és egyéb problémák, például hiányzó biztonsági pecsét, törött alkatrész…).
A szabályalapú gépi látás az ismert változókészlettel kiváló eredményekhez vezet: Megvan egy alkatrész vagy hiányzik? Pontosan milyen messze van ez az objektum a másiktól? Hol kell ennek a robotnak felvennie ezt az alkatrészt? Ezeket a feladatokat könnyű teljesíteni egy futószalagon, ellenőrzött környezetben. De mi történik, ha a dolgok nem olyan világosak?
Itt lép be a játékba a mélytanulás:
• Megoldás azon vision alkalmazások esetében, aamelyeket szabályalapú algoritmusokkal túl nehéz programozni,
• Kezeli a zavaró háttereket és az alkatrész megjelenítésben mutatkozó eltéréseket,
• Karbantartja az alkalmazásokat, és az üzem új képadataival továbbképzi önmagát,
• Az alaphálózatok újraprogramozása nélkül alkalmazkodik az új példákhoz.
Egy tipikus ipari példa: karcolások keresése az elektronikus eszközök képernyőjén. Ezek a hibák eltérőek lehetnek mind méretüket, terjedelmüket, helyzetüket, vagy a különböző háttérrel rendelkező képernyőkön történő megjelenésüket tekintve. Az ilyen variációk figyelembevételével a mélytanulás megmutatja a különbséget a jó és a hibás termékek között. Ráadásul a hálózat új célokra (például másfajta képernyőre) történő betanítása ugyanolyan egyszerű, mint egy új referenciakép készítése.
A vizuálisan hasonló, bonyolult felületi textúrájú és változatos megjelenésű eltérések ellenőrzése komoly kihívást jelent a hagyományos szabályalapú gépi látórendszerek számára. A „funkcionális”, a felhasználhatóságot befolyásoló hibákat szinte mindig kiszűrik, de ez nem feltétlenül igaz a „kozmetikai” rendellenességek esetében, amelyek már a gyártó igényeitől és preferenciáitól függenek. Sőt mi több: ezeket a hibákat a hagyományos gépi látórendszer is nehezen különbözteti meg.
Számos olyan tényező miatt, amelyeket nehezen lehet egymástól elkülöníteni (világítás, színváltozások, görbület vagy látómező), néhány hibadetektálást közismerten nehéz programozni és megoldani egy hagyományos gépi látórendszerrel. Ilyenkor jelent megoldást a mélytanulás.
Röviden: a hagyományos gépi látórendszerek megbízhatóan működnek az egységes és megfelelően gyártott alkatrészek esetében, viszont a bonyolultabb programozást igénylő feladatoknál, és a lehetséges hibafaktorok számának növekedésekor nehézségekbe ütközik a hagyományos módszer. Az olyan összetett helyzetekben, amelyekben az emberéhez hasonló látást igényel a számítógép sebessége és megbízhatósága, a mélytanulás valóban képes megváltoztatni a játékszabályokat.
A mélytanulás előnyei az ipari gyártásban
A szabályalapú gépi látás és a mélytanuláson alapuló képanalízis kiegészítik egymást, nem pedig vagy-vagy lehetőségként működnek a következő generációs gyári automatizálási eszközök adaptálásakor. Egyes alkalmazásokban, például a méréstechnikában a szabályalapú gépi látás továbbra is az előnyben részesített és költséghatékony választás. A nagy eltéréseket és kiszámíthatatlan hibákat magában foglaló összetett ellenőrzésekhez – amelyek túl bonyolultak a hagyományos gépi látórendszerben történő programozáshoz és karbantartáshoz – kiváló alternatívát jelentenek a mélytanulásra épülő eszközök.
Ha többet szeretne megtudni a Cognex mélytanulási megoldásairól, kérjük, látogasson el a cognex.com/ViDi-deep-learning weboldalra.
További információkért kérem forduljon …