Konwolucyjna sieć neuronowa (CNN): uczenie komputerów, jak widzieć

KREDYT WZROKU:
Image credit
iStock

Konwolucyjna sieć neuronowa (CNN): uczenie komputerów, jak widzieć

Konwolucyjna sieć neuronowa (CNN): uczenie komputerów, jak widzieć

Tekst podtytułu
Konwolucyjne sieci neuronowe (CNN) szkolą sztuczną inteligencję, aby lepiej identyfikowała i klasyfikowała obrazy i dźwięk.
    • Autor:
    • nazwisko autora
      Foresight Quantumrun
    • 1 grudnia 2023 r.

    Podsumowanie spostrzeżeń

    Konwolucyjne sieci neuronowe (CNN) odgrywają kluczową rolę w klasyfikacji obrazów i widzeniu komputerowym, zmieniając sposób, w jaki maszyny identyfikują i rozumieją dane wizualne. Naśladują ludzki wzrok, przetwarzając obrazy poprzez warstwy splotowe, łączenia i w pełni połączone w celu ekstrakcji i analizy cech. Sieci CNN mają różnorodne zastosowania, w tym sprzedaż detaliczną w celu uzyskania rekomendacji produktów, motoryzację w celu poprawy bezpieczeństwa, opiekę zdrowotną w celu wykrywania nowotworów i technologię rozpoznawania twarzy. Ich zastosowanie rozciąga się na analizę dokumentów, genetykę i analizę zdjęć satelitarnych. W miarę rosnącej integracji z różnymi sektorami stacje CNN budzą wątpliwości etyczne, zwłaszcza dotyczące technologii rozpoznawania twarzy i prywatności danych, podkreślając potrzebę dokładnego rozważenia ich wdrożenia.

    Kontekst konwolucyjnej sieci neuronowej (CNN).

    CNN to model głębokiego uczenia się inspirowany sposobem, w jaki ludzie i zwierzęta wykorzystują oczy do identyfikowania obiektów. Komputery nie mają takiej możliwości; kiedy „oglądają” obraz, jest on tłumaczony na cyfry. Tym samym CNN odróżniają się od innych sieci neuronowych zaawansowanymi możliwościami analizy danych sygnału obrazu i dźwięku. Zostały zaprojektowane tak, aby automatycznie i adaptacyjnie uczyć się przestrzennych hierarchii obiektów, od wzorców niskiego do wysokiego poziomu. Sieci CNN mogą pomóc komputerowi w zdobyciu „ludzkich” oczu i zapewnić mu widzenie komputerowe, umożliwiając mu wchłonięcie wszystkich widzianych pikseli i liczb, a także pomóc w rozpoznawaniu i klasyfikacji obrazów. 

    ConvNets implementują funkcje aktywacji na mapie funkcji, aby pomóc maszynie w określeniu tego, co widzi. Proces ten jest możliwy dzięki trzem głównym warstwom: warstwie splotowej, pulowaniu i warstwom w pełni połączonym. Pierwsze dwie (konwolucyjne i pulowe) wykonują ekstrakcję danych, podczas gdy w pełni połączona warstwa generuje dane wyjściowe, takie jak klasyfikacja. Mapa obiektów jest przenoszona z warstwy na warstwę, aż komputer będzie mógł zobaczyć cały obraz. CNN otrzymują jak najwięcej informacji w celu wykrycia różnych cech. Każąc komputerom szukać krawędzi i linii, maszyny te uczą się, jak szybko i dokładnie identyfikować obrazy z szybkością niemożliwą dla człowieka.

    Zakłócający wpływ

    Chociaż sieci CNN są najczęściej używane do zadań rozpoznawania i klasyfikacji obrazów, można je również wykorzystać do wykrywania i segmentacji. Na przykład w handlu detalicznym stacje CNN mogą wyszukiwać wizualnie, aby zidentyfikować i polecić elementy, które uzupełniają istniejącą garderobę. W motoryzacji sieci te mogą monitorować zmiany warunków drogowych, na przykład wykrywać linię pasa ruchu, aby poprawić bezpieczeństwo. W opiece zdrowotnej sieci CNN wykorzystuje się do lepszej identyfikacji guzów nowotworowych poprzez oddzielenie uszkodzonych komórek od otaczających je zdrowych narządów. Tymczasem CNN ulepszyły technologię rozpoznawania twarzy, umożliwiając platformom mediów społecznościowych identyfikację osób na zdjęciach i wydawanie rekomendacji dotyczących tagowania. (Jednak Facebook zdecydował się zaprzestać tej funkcji w 2021 r., powołując się na rosnące obawy etyczne i niejasne zasady regulacyjne dotyczące korzystania z tej technologii). 

    Analiza dokumentów może również zostać ulepszona dzięki CNN. Mogą zweryfikować pracę napisaną odręcznie, porównać ją z bazą danych zawierającą treść odręczną, zinterpretować słowa i nie tylko. Mogą skanować odręczne dokumenty o kluczowym znaczeniu dla bankowości i finansów lub klasyfikacji dokumentów dla muzeów. W genetyce sieci te mogą oceniać hodowle komórkowe pod kątem badań nad chorobami poprzez analizę zdjęć, mapowanie i analizy predykcyjne, aby pomóc ekspertom medycznym w opracowaniu potencjalnych metod leczenia. Wreszcie warstwy splotowe mogą pomóc w kategoryzowaniu zdjęć satelitarnych i szybkiej identyfikacji, czym one są, co może pomóc w eksploracji kosmosu.

    Zastosowania splotowej sieci neuronowej (CNN)

    Niektóre zastosowania splotowej sieci neuronowej (CNN) mogą obejmować: 

    • Zwiększone zastosowanie w diagnostyce zdrowotnej, w tym w radiologii, prześwietleniach rentgenowskich i chorobach genetycznych.
    • Wykorzystanie CNN do klasyfikacji obrazów przesyłanych strumieniowo z promów i stacji kosmicznych oraz łazików księżycowych. Agencje obrony mogą stosować CNN do satelitów obserwacyjnych i dronów w celu autonomicznej identyfikacji i oceny zagrożeń dla bezpieczeństwa lub militarnych.
    • Ulepszona technologia optycznego rozpoznawania znaków w przypadku tekstów pisanych odręcznie i rozpoznawania obrazów.
    • Ulepszone zastosowania robotów sortujących w magazynach i zakładach recyklingu.
    • Ich zastosowanie w klasyfikacji przestępców i osób będących przedmiotem zainteresowania na podstawie kamer monitoringu miejskiego lub wewnętrznego. Jednakże metoda ta może podlegać błędom.
    • Coraz więcej firm pyta się o wykorzystanie technologii rozpoznawania twarzy, w tym o sposób gromadzenia i wykorzystywania danych.

    Pytania do skomentowania

    • Jak jeszcze, Twoim zdaniem, CNN mogą poprawić widzenie w komputerze i sposób, w jaki z niego korzystamy na co dzień?
    • Jakie są inne możliwe korzyści z lepszego rozpoznawania i klasyfikacji obrazów?

    Referencje informacyjne

    W celu uzyskania tego wglądu odniesiono się do następujących popularnych i instytucjonalnych powiązań: