Konvolúciós neurális hálózat (CNN): A számítógépek látásának megtanítása

KÉP HITEL:
Kép hitel
iStock

Konvolúciós neurális hálózat (CNN): A számítógépek látásának megtanítása

Konvolúciós neurális hálózat (CNN): A számítógépek látásának megtanítása

Alcím szövege
A konvolúciós neurális hálózatok (CNN-ek) a mesterséges intelligencia képzését végzik a képek és hangok jobb azonosítására és osztályozására.
    • Szerző:
    • Szerző neve
      Quantumrun Foresight
    • December 1, 2023

    Insight összefoglaló

    A konvolúciós neurális hálózatok (CNN-ek) kulcsfontosságúak a képosztályozásban és a számítógépes látásban, megváltoztatva a gépek vizuális adatok azonosítását és megértését. Utánozzák az emberi látást, a képeket konvolúciós, egyesített és teljesen összekapcsolt rétegeken dolgozzák fel a jellemzők kinyeréséhez és elemzéséhez. A CNN-ek sokféle alkalmazási területtel rendelkeznek, beleértve a termékajánlások kiskereskedelmét, az autóiparban a biztonsági fejlesztéseket, az egészségügyi ellátást a daganatok felismeréséhez és az arcfelismerő technológiát. Felhasználásuk kiterjed a dokumentumelemzésre, a genetikára és a műholdképek elemzésére. A különböző ágazatokba való növekvő integrációjukkal a CNN-ek etikai aggályokat vetnek fel, különösen az arcfelismerő technológia és az adatvédelem tekintetében, rámutatva arra, hogy gondosan mérlegelni kell telepítésüket.

    Konvolúciós neurális hálózat (CNN) kontextus

    A CNN egy mély tanulási modell, amelyet az ihletett, hogy az emberek és az állatok hogyan használják a szemüket tárgyak azonosítására. A számítógépek nem rendelkeznek ezzel a képességgel; amikor „megnéznek” egy képet, azt számjegyekre fordítják. Így a CNN-eket a kép- és hangjeladatok elemzésére szolgáló fejlett képességeik különböztetik meg a többi neurális hálózattól. Úgy tervezték őket, hogy automatikusan és adaptív módon megtanulják a jellemzők térbeli hierarchiáját, az alacsonytól a magas szintű mintáig. A CNN-ek segíthetik a számítógépet az „emberi” szemek megszerzésében, és számítógépes látást biztosítanak számára, lehetővé téve számára, hogy elnyelje az összes általa látott pixelt és számot, és segítse a képfelismerést és osztályozást. 

    A ConvNets aktiválási funkciókat valósít meg egy jellemzőtérképen, hogy segítse a gépet annak meghatározásában, hogy mit lát. Ezt a folyamatot három fő réteg teszi lehetővé: a konvolúciós, a pooling és a teljesen összekapcsolt rétegek. Az első kettő (konvolúciós és pooling) végzi az adatkinyerést, míg a teljesen összekapcsolt réteg kimenetet generál, például osztályozást. A tereptérkép rétegről rétegre átvitelre kerül, amíg a számítógép nem látja a teljes képet. A CNN-ek a lehető legtöbb információt kapják a különböző jellemzők észleléséhez. Azáltal, hogy felszólítják a számítógépeket, hogy keressenek éleket és vonalakat, ezek a gépek megtanulják, hogyan lehet gyorsan és pontosan azonosítani a képeket olyan sebességgel, amely az ember számára lehetetlen.

    Bomlasztó hatás

    Míg a CNN-eket leggyakrabban képfelismerési és osztályozási feladatokra használják, felderítésre és szegmentálásra is használhatók. Például a kiskereskedelemben a CNN-ek vizuálisan kereshetnek, hogy azonosítsák és ajánlhassák azokat a cikkeket, amelyek kiegészítik a meglévő ruhatárat. Az autóiparban ezek a hálózatok figyelhetik az útviszonyok változásait, például a sávfelismerést a biztonság javítása érdekében. Az egészségügyben a CNN-eket a rákos daganatok jobb azonosítására használják azáltal, hogy szegmentálják ezeket a sérült sejteket a körülöttük lévő egészséges szervekből. Eközben a CNN-ek továbbfejlesztették az arcfelismerő technológiát, lehetővé téve a közösségi média platformok számára, hogy azonosítsák a fotókon szereplő személyeket, és címkézési javaslatokat adjanak. (A Facebook azonban úgy döntött, hogy 2021-ben leállítja ezt a funkciót, a növekvő etikai aggályokra és a technológia használatára vonatkozó tisztázatlan szabályozási politikákra hivatkozva.) 

    A dokumentumelemzés is javítható a CNN-ekkel. Ellenőrizhetik a kézzel írt műveket, összehasonlíthatják a kézzel írt tartalom adatbázisával, értelmezhetik a szavakat és így tovább. Beszkennelhetik a banki és pénzügyek szempontjából kritikus kézírásos papírokat vagy a múzeumok dokumentumosztályozását. A genetika területén ezek a hálózatok képesek a sejtkultúrákat értékelni a betegségkutatáshoz azáltal, hogy képeket, térképeket és prediktív elemzéseket vizsgálnak, hogy segítsenek az orvosi szakértőknek a lehetséges kezelések kidolgozásában. Végül a konvolúciós rétegek segíthetnek a műholdképek kategorizálásában és gyors azonosításában, ami segíthet az űrkutatásban.

    A konvolúciós neurális hálózat (CNN) alkalmazásai

    A konvolúciós neurális hálózat (CNN) egyes alkalmazásai a következők lehetnek: 

    • Fokozott felhasználás az egészségügyi diagnosztikában, beleértve a radiológiát, a röntgensugarakat és a genetikai betegségeket.
    • A CNN-ek használata űrsiklóról, űrállomásokról és holdjárókról származó streamelt képek osztályozására. A védelmi ügynökségek CNN-eket alkalmazhatnak megfigyelő műholdakra és drónokra a biztonsági vagy katonai fenyegetések autonóm azonosítására és értékelésére.
    • Továbbfejlesztett optikai karakterfelismerő technológia kézzel írt szövegekhez és képfelismeréshez.
    • Továbbfejlesztett robotizált válogatóalkalmazások raktárakban és újrahasznosító létesítményekben.
    • Használatuk bûnözõk és érdeklõdõ személyek osztályozására városi vagy beltéri térfigyelõ kamerákból. Ez a módszer azonban előítéletes lehet.
    • Több céget kérdőjeleznek meg az arcfelismerő technológia használatáról, beleértve azt is, hogyan gyűjtik és használják fel az adatokat.

    Kérdések, amelyekhez hozzászólni kell

    • Ön szerint hogyan javíthatják a CNN-ek a számítógépes látást, és hogyan használjuk azt naponta?
    • Milyen további lehetséges előnyökkel jár a jobb képfelismerés és osztályozás?

    Insight hivatkozások

    A következő népszerű és intézményi hivatkozásokra hivatkoztunk ehhez a betekintéshez: