Red neuronal convolucional (CNN): enseñar a las computadoras a ver

CREDITO DE IMAGEN:
Crédito de la imagen
iStock

Red neuronal convolucional (CNN): enseñar a las computadoras a ver

Red neuronal convolucional (CNN): enseñar a las computadoras a ver

Subtítulo de texto
Las redes neuronales convolucionales (CNN) están entrenando a la IA para identificar y clasificar mejor imágenes y audio.
    • Escrito por:
    • Nombre del autor
      Previsión Quantumrun
    • 1 de diciembre de 2023

    Resumen de información

    Las redes neuronales convolucionales (CNN) son fundamentales en la clasificación de imágenes y la visión por computadora, transformando la forma en que las máquinas identifican y comprenden los datos visuales. Imitan la visión humana y procesan imágenes a través de capas convolucionales, de agrupación y completamente conectadas para la extracción y el análisis de características. Las CNN tienen diversas aplicaciones, incluida la venta minorista para recomendaciones de productos, la industria automotriz para mejoras de seguridad, la atención médica para la detección de tumores y la tecnología de reconocimiento facial. Su uso se extiende al análisis de documentos, la genética y el análisis de imágenes satelitales. Con su creciente integración en diversos sectores, las CNN plantean preocupaciones éticas, especialmente en relación con la tecnología de reconocimiento facial y la privacidad de los datos, lo que destaca la necesidad de una consideración cuidadosa de su implementación.

    Contexto de la red neuronal convolucional (CNN)

    Las CNN son un modelo de aprendizaje profundo inspirado en cómo los humanos y los animales usan sus ojos para identificar objetos. Las computadoras no tienen esta capacidad; cuando “ven” una imagen, se traduce en dígitos. Por lo tanto, las CNN se distinguen de otras redes neuronales por sus capacidades avanzadas para analizar datos de señales de imagen y audio. Están diseñados para aprender de forma automática y adaptativa jerarquías espaciales de características, desde patrones de bajo hasta alto nivel. Las CNN pueden ayudar a una computadora a adquirir ojos "humanos" y proporcionarle visión por computadora, permitiéndole absorber todos los píxeles y números que ve y ayudar en el reconocimiento y clasificación de imágenes. 

    ConvNets implementa funciones de activación en un mapa de características para ayudar a la máquina a determinar lo que ve. Este proceso está habilitado por tres capas principales: la convolucional, la de agrupación y la capa completamente conectada. Las dos primeras (convolucional y de agrupación) realizan la extracción de datos, mientras que la capa completamente conectada genera resultados, como la clasificación. El mapa de características se transfiere de una capa a otra hasta que la computadora puede ver la imagen completa. Las CNN reciben tanta información como sea posible para detectar diferentes características. Al decirle a las computadoras que busquen bordes y líneas, estas máquinas aprenden a identificar imágenes de manera rápida y precisa a velocidades que son imposibles para los humanos.

    Impacto disruptivo

    Si bien las CNN se usan más comúnmente para tareas de clasificación y reconocimiento de imágenes, también se pueden usar para detección y segmentación. Por ejemplo, en el comercio minorista, las CNN pueden buscar visualmente para identificar y recomendar artículos que complementen un guardarropa existente. En el sector automovilístico, estas redes pueden estar atentas a los cambios en las condiciones de la carretera, como la detección de líneas de carril, para mejorar la seguridad. En el sector sanitario, las CNN se utilizan para identificar mejor los tumores cancerosos segmentando estas células dañadas de los órganos sanos que los rodean. Mientras tanto, las CNN han mejorado la tecnología de reconocimiento facial, lo que permite que las plataformas de redes sociales identifiquen a las personas en fotografías y brinden recomendaciones de etiquetado. (Sin embargo, Facebook decidió suspender esta función en 2021, citando crecientes preocupaciones éticas y políticas regulatorias poco claras sobre el uso de esta tecnología). 

    El análisis de documentos también puede mejorar con las CNN. Pueden verificar un trabajo escrito a mano, compararlo con una base de datos de contenido escrito a mano, interpretar las palabras y más. Pueden escanear documentos escritos a mano fundamentales para la banca y las finanzas o la clasificación de documentos para museos. En genética, estas redes pueden evaluar cultivos celulares para la investigación de enfermedades mediante el examen de imágenes, mapeos y análisis predictivos para ayudar a los expertos médicos a desarrollar tratamientos potenciales. Finalmente, las capas convolucionales pueden ayudar a categorizar imágenes de satélite e identificar rápidamente cuáles son, lo que puede ayudar en la exploración espacial.

    Aplicaciones de la red neuronal convolucional (CNN)

    Algunas aplicaciones de la red neuronal convolucional (CNN) pueden incluir: 

    • Mayor uso en diagnósticos sanitarios, incluida la radiología, los rayos X y las enfermedades genéticas.
    • El uso de CNN para clasificar imágenes transmitidas desde estaciones y transbordadores espaciales y vehículos lunares. Las agencias de defensa pueden aplicar CNN a satélites de vigilancia y drones para la identificación y evaluación autónoma de amenazas militares o de seguridad.
    • Tecnología mejorada de reconocimiento óptico de caracteres para textos escritos a mano y reconocimiento de imágenes.
    • Aplicaciones mejoradas de clasificación robótica en almacenes e instalaciones de reciclaje.
    • Su uso en la clasificación de delincuentes y personas de interés a partir de cámaras de vigilancia urbanas o interiores. Sin embargo, este método puede estar sujeto a sesgos.
    • Cada vez se cuestiona más a las empresas sobre su uso de la tecnología de reconocimiento facial, incluida la forma en que recopilan y utilizan los datos.

    Preguntas para comentar

    • ¿De qué otra manera crees que las CNN pueden mejorar la visión por computadora y cómo la usamos a diario?
    • ¿Cuáles son los otros posibles beneficios de un mejor reconocimiento y clasificación de imágenes?

    Referencias de información

    Se hizo referencia a los siguientes enlaces populares e institucionales para esta perspectiva: