Course quantique

CRÉDIT D'IMAGE:

iStock

Réseau neuronal convolutif (CNN) : apprendre aux ordinateurs à voir

Les réseaux de neurones convolutifs (CNN) entraînent l’IA à mieux identifier et classer les images et l’audio.

Auteur :
Nom de l'auteur
Prévision quantique
1 décembre 2023

Résumé des informations

Les réseaux de neurones convolutifs (CNN) jouent un rôle essentiel dans la classification des images et la vision par ordinateur, transformant la façon dont les machines identifient et comprennent les données visuelles. Ils imitent la vision humaine, traitant les images via des couches convolutives, regroupées et entièrement connectées pour l'extraction et l'analyse des caractéristiques. Les CNN ont diverses applications, notamment la vente au détail pour les recommandations de produits, l'automobile pour l'amélioration de la sécurité, les soins de santé pour la détection des tumeurs et la technologie de reconnaissance faciale. Leur utilisation s'étend à l'analyse de documents, à la génétique et à l'analyse d'images satellite. Avec leur intégration croissante dans divers secteurs, les CNN soulèvent des préoccupations éthiques, notamment en ce qui concerne la technologie de reconnaissance faciale et la confidentialité des données, soulignant la nécessité d'un examen attentif de leur déploiement.

Contexte du réseau de neurones convolutifs (CNN)

Les CNN sont un modèle d'apprentissage profond inspiré de la façon dont les humains et les animaux utilisent leurs yeux pour identifier des objets. Les ordinateurs n'ont pas cette capacité ; lorsqu’ils « visualisent » une image, celle-ci est traduite en chiffres. Ainsi, les CNN se distinguent des autres réseaux de neurones par leurs capacités avancées d’analyse des données d’images et de signaux audio. Ils sont conçus pour apprendre automatiquement et de manière adaptative les hiérarchies spatiales de caractéristiques, des modèles de bas niveau aux modèles de haut niveau. Les CNN peuvent aider un ordinateur à acquérir des yeux « humains » et lui fournir une vision par ordinateur, lui permettant d’absorber tous les pixels et nombres qu’il voit et faciliter la reconnaissance et la classification des images.

Les ConvNets implémentent des fonctions d'activation dans une carte de fonctionnalités pour aider la machine à déterminer ce qu'elle voit. Ce processus est activé par trois couches principales : les couches convolutionnelles, de mise en commun et entièrement connectées. Les deux premiers (convolutionnel et pooling) effectuent l'extraction des données, tandis que la couche entièrement connectée génère une sortie, telle que la classification. La carte des caractéristiques est transférée de couche en couche jusqu'à ce que l'ordinateur puisse voir l'image entière. Les CNN reçoivent autant d’informations que possible pour détecter différentes caractéristiques. En demandant aux ordinateurs de rechercher des bords et des lignes, ces machines apprennent à identifier rapidement et précisément les images à une vitesse impossible pour les humains.

Impact perturbateur

Bien que les CNN soient le plus souvent utilisés pour les tâches de reconnaissance et de classification d’images, ils peuvent également être utilisés pour la détection et la segmentation. Par exemple, dans le commerce de détail, les CNN peuvent effectuer une recherche visuelle pour identifier et recommander des articles qui complètent une garde-robe existante. Dans le secteur automobile, ces réseaux peuvent surveiller les changements dans les conditions routières, comme la détection des lignes de voie, pour améliorer la sécurité. Dans le domaine de la santé, les CNN sont utilisés pour mieux identifier les tumeurs cancéreuses en segmentant ces cellules endommagées des organes sains qui les entourent. Pendant ce temps, les CNN ont amélioré la technologie de reconnaissance faciale, permettant aux plateformes de médias sociaux d'identifier les personnes sur les photos et de donner des recommandations de marquage. (Cependant, Facebook a décidé de supprimer cette fonctionnalité en 2021, invoquant des préoccupations éthiques croissantes et des politiques réglementaires peu claires sur l'utilisation de cette technologie).

L'analyse des documents peut également s'améliorer avec les CNN. Ils peuvent vérifier une œuvre manuscrite, la comparer à une base de données de contenu manuscrit, interpréter les mots, etc. Ils peuvent numériser des documents manuscrits essentiels aux opérations bancaires et financières ou à la classification de documents pour les musées. En génétique, ces réseaux peuvent évaluer des cultures cellulaires pour la recherche sur les maladies en examinant des images, des cartographies et des analyses prédictives pour aider les experts médicaux à développer des traitements potentiels. Enfin, les couches convolutives peuvent aider à catégoriser les images satellite et à identifier rapidement de quoi il s’agit, ce qui peut faciliter l’exploration spatiale.

Applications du réseau neuronal convolutif (CNN)

Certaines applications du réseau neuronal convolutif (CNN) peuvent inclure :

Utilisation accrue dans les diagnostics de soins de santé, notamment la radiologie, les rayons X et les maladies génétiques.
L'utilisation des CNN pour classer les images diffusées en continu par les navettes et stations spatiales et les rovers lunaires. Les agences de défense peuvent appliquer les CNN aux satellites de surveillance et aux drones pour une identification et une évaluation autonomes des menaces sécuritaires ou militaires.
Technologie améliorée de reconnaissance optique de caractères pour les textes manuscrits et la reconnaissance d’images.
Applications de tri robotisées améliorées dans les entrepôts et les installations de recyclage.
Leur utilisation pour classer les criminels et les personnes d'intérêt à partir des caméras de surveillance urbaines ou intérieures. Cependant, cette méthode peut être sujette à des biais.
De plus en plus d'entreprises sont interrogées sur leur utilisation de la technologie de reconnaissance faciale, notamment sur la manière dont elles collectent et utilisent les données.

Questions à commenter

Sinon, comment pensez-vous que les CNN peuvent améliorer la vision par ordinateur et comment nous les utilisons quotidiennement ?
Quels sont les autres avantages possibles d’une meilleure reconnaissance et classification des images ?

Ajouter à la liste