Convolutional neural network (CNN): Lær computere at se

BILLEDKREDIT:
Image credit
iStock

Convolutional neural network (CNN): Lær computere at se

Convolutional neural network (CNN): Lær computere at se

Underoverskriftstekst
Konvolutionelle neurale netværk (CNN'er) træner AI til bedre at identificere og klassificere billeder og lyd.
    • Forfatter:
    • Forfatter navn
      Quantumrun Foresight
    • 1. December, 2023

    Oversigt over indsigt

    Convolutional Neural Networks (CNN'er) er afgørende i billedklassificering og computersyn, og transformerer, hvordan maskiner identificerer og forstår visuelle data. De efterligner menneskesyn, behandler billeder gennem foldning, pooling og fuldt forbundne lag til udtræk og analyse af funktioner. CNN'er har forskellige applikationer, herunder detailhandel for produktanbefalinger, bilindustrien til sikkerhedsforbedringer, sundhedspleje til tumordetektion og ansigtsgenkendelsesteknologi. Deres brug strækker sig til at dokumentere analyse, genetik og analyse af satellitbilleder. Med deres stigende integration i forskellige sektorer rejser CNN'er etiske bekymringer, især med hensyn til ansigtsgenkendelsesteknologi og databeskyttelse, hvilket understreger behovet for omhyggelig overvejelse af deres implementering.

    Konvolutionelt neuralt netværk (CNN) kontekst

    CNN'er er en dyb læringsmodel inspireret af, hvordan mennesker og dyr bruger deres øjne til at identificere objekter. Computere har ikke denne mulighed; når de "ser" et billede, bliver det oversat til cifre. Således adskiller CNN'er sig fra andre neurale netværk ved deres avancerede evner til at analysere billed- og lydsignaldata. De er designet til automatisk og adaptivt at lære rumlige hierarkier af funktioner, fra mønstre på lavt til højt niveau. CNN'er kan hjælpe en computer med at erhverve "menneskelige" øjne og give den computersyn, så den kan absorbere alle de pixels og tal, den ser, og hjælpe med billedgenkendelse og klassificering. 

    ConvNets implementerer aktiveringsfunktioner i et funktionskort for at hjælpe maskinen med at bestemme, hvad den ser. Denne proces aktiveres af tre hovedlag: det foldede lag, det poolende lag og det fuldt forbundne lag. De to første (foldning og pooling) udfører dataudtrækningen, mens det fuldt forbundne lag genererer output, såsom klassifikation. Funktionskortet overføres fra lag til lag, indtil computeren kan se hele billedet. CNN'er får så meget information som muligt for at opdage forskellige karakteristika. Ved at bede computere om at lede efter kanter og linjer, lærer disse maskiner, hvordan de hurtigt og præcist identificerer billeder med hastigheder, der er umulige for mennesker.

    Forstyrrende påvirkning

    Mens CNN'er oftest bruges til billedgenkendelse og klassificeringsopgaver, kan de også bruges til detektion og segmentering. For eksempel i detailhandelen kan CNN'er visuelt søge for at identificere og anbefale varer, der komplementerer en eksisterende garderobe. Inden for bilindustrien kan disse netværk holde øje med ændringer i vejforholdene som f.eks. vognbaneregistrering for at forbedre sikkerheden. I sundhedsvæsenet bruges CNN'er til bedre at identificere kræftsvulster ved at segmentere disse beskadigede celler fra de sunde organer omkring dem. I mellemtiden har CNN'er forbedret ansigtsgenkendelsesteknologi, hvilket gør det muligt for sociale medieplatforme at identificere personer på billeder og give tagging-anbefalinger. (Facebook har dog besluttet at stoppe denne funktion i 2021 under henvisning til voksende etiske bekymringer og uklare lovgivningsmæssige politikker for brug af denne teknologi). 

    Dokumentanalyse kan også forbedres med CNN'er. De kan verificere et håndskrevet værk, sammenligne det med en database med håndskrevet indhold, fortolke ordene og mere. De kan scanne håndskrevne papirer, der er vigtige for bank- og finanssektoren eller dokumentklassificering for museer. Inden for genetik kan disse netværk evaluere cellekulturer til sygdomsforskning ved at undersøge billeder og kortlægning og prædiktive analyser for at hjælpe medicinske eksperter med at udvikle potentielle behandlinger. Endelig kan foldningslag hjælpe med at kategorisere satellitbilleder og hurtigt identificere, hvad de er, hvilket kan hjælpe med udforskning af rummet.

    Anvendelser af convolutional neural network (CNN)

    Nogle anvendelser af convolutional neural network (CNN) kan omfatte: 

    • Øget brug i sundhedsfaglige diagnoser, herunder radiologi, røntgen og genetiske sygdomme.
    • Brugen af ​​CNN'er til at klassificere streamede billeder fra rumfærger og stationer og månerovere. Forsvarsagenturer kan anvende CNN'er til overvågningssatellitter og droner til autonom identifikation og vurdering af sikkerhed eller militære trusler.
    • Forbedret optisk tegngenkendelsesteknologi til håndskrevne tekster og billedgenkendelse.
    • Forbedrede robotsorteringsapplikationer i lagre og genbrugsfaciliteter.
    • Deres brug til at klassificere kriminelle og personer af interesse fra by- eller indvendige overvågningskameraer. Denne metode kan dog være genstand for skævheder.
    • Flere virksomheder bliver spurgt om deres brug af ansigtsgenkendelsesteknologi, herunder hvordan de indsamler og bruger data.

    Spørgsmål at kommentere på

    • Hvordan tror du ellers, at CNN'er kan forbedre computersyn, og hvordan vi bruger det dagligt?
    • Hvad er de andre mulige fordele ved bedre billedgenkendelse og klassificering?

    Indsigtsreferencer

    Følgende populære og institutionelle links blev refereret til denne indsigt: