Rete neurale convoluzionale (CNN): insegnare ai computer come vedere

CREDITO IMMAGINE:
Immagine di credito
iStock

Rete neurale convoluzionale (CNN): insegnare ai computer come vedere

Rete neurale convoluzionale (CNN): insegnare ai computer come vedere

Testo del sottotitolo
Le reti neurali convoluzionali (CNN) stanno addestrando l’intelligenza artificiale a identificare e classificare meglio immagini e audio.
    • Autore:
    • Nome dell'autore
      Preveggenza quantistica
    • Dicembre 1, 2023

    Riepilogo approfondimenti

    Le reti neurali convoluzionali (CNN) sono fondamentali nella classificazione delle immagini e nella visione artificiale, trasformando il modo in cui le macchine identificano e comprendono i dati visivi. Imitano la visione umana, elaborando le immagini attraverso livelli convoluzionali, di pooling e completamente connessi per l'estrazione e l'analisi delle funzionalità. Le CNN hanno diverse applicazioni, tra cui vendita al dettaglio per consigli sui prodotti, settore automobilistico per miglioramenti della sicurezza, assistenza sanitaria per il rilevamento di tumori e tecnologia di riconoscimento facciale. Il loro utilizzo si estende all'analisi dei documenti, alla genetica e all'analisi delle immagini satellitari. Con la loro crescente integrazione in vari settori, le CNN sollevano preoccupazioni etiche, in particolare per quanto riguarda la tecnologia di riconoscimento facciale e la privacy dei dati, evidenziando la necessità di un’attenta considerazione della loro implementazione.

    Contesto della rete neurale convoluzionale (CNN).

    Le CNN sono un modello di deep learning ispirato al modo in cui gli esseri umani e gli animali usano i loro occhi per identificare gli oggetti. I computer non hanno questa capacità; quando “visualizzano” un'immagine, questa viene tradotta in cifre. Pertanto, le CNN si distinguono dalle altre reti neurali per le loro capacità avanzate di analisi dei dati di immagini e segnali audio. Sono progettati per apprendere automaticamente e in modo adattivo le gerarchie spaziali delle caratteristiche, dai modelli di livello basso a quello di alto livello. Le CNN possono aiutare un computer ad acquisire occhi “umani” e fornirgli la visione artificiale, permettendogli di assorbire tutti i pixel e i numeri che vede e aiutandolo nel riconoscimento e nella classificazione delle immagini. 

    ConvNet implementa funzioni di attivazione in una mappa delle caratteristiche per aiutare la macchina a determinare ciò che vede. Questo processo è abilitato da tre livelli principali: il livello convoluzionale, quello di pooling e quello completamente connesso. I primi due (convoluzionale e di pooling) eseguono l'estrazione dei dati, mentre il livello completamente connesso genera output, come la classificazione. La mappa delle caratteristiche viene trasferita da un livello all'altro finché il computer non riesce a vedere l'intera immagine. Alle CNN vengono fornite quante più informazioni possibili per rilevare caratteristiche diverse. Dicendo ai computer di cercare bordi e linee, queste macchine imparano a identificare le immagini in modo rapido e accurato a velocità impossibili per gli esseri umani.

    Impatto dirompente

    Sebbene le CNN siano più comunemente utilizzate per attività di riconoscimento e classificazione delle immagini, possono anche essere utilizzate per il rilevamento e la segmentazione. Ad esempio, nella vendita al dettaglio, le CNN possono effettuare ricerche visive per identificare e consigliare articoli che completano un guardaroba esistente. Nel settore automobilistico, queste reti possono monitorare i cambiamenti nelle condizioni stradali come il rilevamento della linea di corsia per migliorare la sicurezza. Nel settore sanitario, le CNN vengono utilizzate per identificare meglio i tumori cancerosi segmentando queste cellule danneggiate dagli organi sani che le circondano. Nel frattempo, le CNN hanno migliorato la tecnologia di riconoscimento facciale, consentendo alle piattaforme di social media di identificare le persone nelle foto e fornire consigli sull’etichettatura. (Tuttavia, Facebook ha deciso di interrompere questa funzionalità nel 2021, citando crescenti preoccupazioni etiche e politiche normative poco chiare sull’utilizzo di questa tecnologia). 

    L'analisi dei documenti può anche migliorare con le CNN. Possono verificare un lavoro scritto a mano, confrontarlo con un database di contenuti scritti a mano, interpretare le parole e altro ancora. Possono scansionare documenti scritti a mano fondamentali per il settore bancario e finanziario o classificare documenti per i musei. Nel campo della genetica, queste reti possono valutare le colture cellulari per la ricerca sulle malattie esaminando immagini, mappature e analisi predittive per assistere gli esperti medici nello sviluppo di potenziali trattamenti. Infine, gli strati convoluzionali possono aiutare a classificare le immagini satellitari e a identificare rapidamente cosa sono, il che può aiutare nell’esplorazione dello spazio.

    Applicazioni della rete neurale convoluzionale (CNN)

    Alcune applicazioni della rete neurale convoluzionale (CNN) possono includere: 

    • Maggiore utilizzo nelle diagnosi sanitarie, tra cui radiologia, raggi X e malattie genetiche.
    • L'uso delle CNN per classificare le immagini in streaming da navette e stazioni spaziali e rover lunari. Le agenzie di difesa possono applicare le CNN ai satelliti di sorveglianza e ai droni per l’identificazione e la valutazione autonome delle minacce alla sicurezza o militari.
    • Tecnologia di riconoscimento ottico dei caratteri migliorata per testi scritti a mano e riconoscimento di immagini.
    • Applicazioni di smistamento robotizzate migliorate nei magazzini e negli impianti di riciclaggio.
    • Il loro utilizzo nella classificazione di criminali e persone di interesse dalle telecamere di sorveglianza urbana o interna. Tuttavia questo metodo può essere soggetto a bias.
    • Sempre più aziende vengono interrogate sul loro utilizzo della tecnologia di riconoscimento facciale, compreso il modo in cui raccolgono e utilizzano i dati.

    Domande da commentare

    • In quale altro modo pensi che le CNN possano migliorare la visione artificiale e il modo in cui la usiamo quotidianamente?
    • Quali sono gli altri possibili vantaggi di un migliore riconoscimento e classificazione delle immagini?

    Riferimenti di approfondimento

    I seguenti collegamenti popolari e istituzionali sono stati referenziati per questa intuizione:

    Università dei governatori occidentali Cos'è una rete neurale convoluzionale? | 3 agosto 2020