Convolutional neural network (CNN): Lära datorer hur man ser

BILDKREDIT:
Bild kredit
iStock

Convolutional neural network (CNN): Lära datorer hur man ser

Convolutional neural network (CNN): Lära datorer hur man ser

Underrubrik text
Konvolutionella neurala nätverk (CNN) tränar AI för att bättre identifiera och klassificera bilder och ljud.
    • Författare:
    • författarnamn
      Quantumrun Framsyn
    • December 1, 2023

    Insiktssammanfattning

    Convolutional Neural Networks (CNN) är centrala i bildklassificering och datorseende, och förändrar hur maskiner identifierar och förstår visuell data. De efterliknar mänsklig vision, bearbetar bilder genom faltning, poolande och helt anslutna lager för funktionsextraktion och analys. CNN har olika applikationer, inklusive detaljhandel för produktrekommendationer, bilindustri för säkerhetsförbättringar, hälsovård för tumördetektering och ansiktsigenkänningsteknik. Deras användning sträcker sig till dokumentanalys, genetik och analys av satellitbilder. Med sin ökande integrering i olika sektorer, tar CNN upp etiska farhågor, särskilt när det gäller ansiktsigenkänningsteknik och datasekretess, vilket understryker behovet av att noggrant överväga deras utplacering.

    Konvolutionellt neuralt nätverk (CNN) sammanhang

    CNN är en modell för djupinlärning inspirerad av hur människor och djur använder sina ögon för att identifiera föremål. Datorer har inte denna funktion; när de "visar" en bild översätts den till siffror. Således särskiljs CNN från andra neurala nätverk genom sina avancerade möjligheter för att analysera bild- och ljudsignaldata. De är designade för att automatiskt och adaptivt lära sig rumsliga hierarkier av funktioner, från mönster på låg till hög nivå. CNN:er kan hjälpa en dator att skaffa "mänskliga" ögon och förse den med datorseende, så att den kan absorbera alla pixlar och siffror den ser och hjälpa till med bildigenkänning och klassificering. 

    ConvNets implementerar aktiveringsfunktioner i en funktionskarta för att hjälpa maskinen att avgöra vad den ser. Denna process möjliggörs av tre huvudlager: det faltande lagret, det sammanslagna lagret och det helt anslutna lagret. De två första (faltning och poolning) utför dataextraktionen, medan det helt anslutna lagret genererar utdata, såsom klassificering. Funktionskartan överförs från lager till lager tills datorn kan se hela bilden. CNN:er ges så mycket information som möjligt för att upptäcka olika egenskaper. Genom att säga åt datorer att leta efter kanter och linjer, lär sig dessa maskiner hur man snabbt och exakt identifierar bilder i hastigheter som är omöjliga för människor.

    Störande inverkan

    Medan CNN är vanligast för bildigenkänning och klassificeringsuppgifter, kan de också användas för upptäckt och segmentering. Till exempel i detaljhandeln kan CNN:s visuellt söka för att identifiera och rekommendera föremål som kompletterar en befintlig garderob. Inom fordonsindustrin kan dessa nätverk se upp för förändringar i vägförhållandena som detektering av körfält för att förbättra säkerheten. Inom sjukvården används CNN för att bättre identifiera cancertumörer genom att segmentera dessa skadade celler från de friska organen runt dem. Samtidigt har CNN:er förbättrat tekniken för ansiktsigenkänning, vilket gör det möjligt för sociala medieplattformar att identifiera personer på foton och ge taggningsrekommendationer. (Facebook har dock beslutat att stoppa denna funktion 2021, med hänvisning till växande etiska farhågor och oklara regleringspolicyer för att använda denna teknik). 

    Dokumentanalys kan också förbättras med CNN. De kan verifiera ett handskrivet verk, jämföra det med en databas med handskrivet innehåll, tolka orden och mer. De kan skanna handskrivna papper som är viktiga för bank och finans eller dokumentklassificering för museer. Inom genetik kan dessa nätverk utvärdera cellkulturer för sjukdomsforskning genom att undersöka bilder och kartlägga och prediktiv analys för att hjälpa medicinska experter att utveckla potentiella behandlingar. Slutligen kan faltningsskikt hjälpa till att kategorisera satellitbilder och snabbt identifiera vad de är, vilket kan hjälpa till vid utforskning av rymden.

    Tillämpningar av Convolutional Neural Network (CNN)

    Vissa tillämpningar av Convolutional Neural Network (CNN) kan inkludera: 

    • Ökad användning i sjukvårdsdiagnoser, inklusive radiologi, röntgen och genetiska sjukdomar.
    • Användningen av CNN:er för att klassificera streamade bilder från rymdfärjor och stationer, och moon rovers. Försvarsorgan kan använda CNN på övervakningssatelliter och drönare för autonom identifiering och bedömning av säkerhet eller militära hot.
    • Förbättrad optisk teckenigenkänningsteknik för handskrivna texter och bildigenkänning.
    • Förbättrade robotsorteringstillämpningar i lager och återvinningsanläggningar.
    • Deras användning för att klassificera brottslingar och personer av intresse från stads- eller interiörövervakningskameror. Denna metod kan dock vara föremål för fördomar.
    • Fler företag förhörs om sin användning av ansiktsigenkänningsteknik, inklusive hur de samlar in och använder data.

    Frågor att kommentera

    • Hur tror du annars att CNN kan förbättra datorseendet och hur vi använder det dagligen?
    • Vilka är de andra möjliga fördelarna med bättre bildigenkänning och klassificering?

    Insiktsreferenser

    Följande populära och institutionella länkar hänvisades till för denna insikt: