La Computer Vision, ce n’est pas si compliqué !

par | Juin 26, 2018 | Tech

computer vision neural network

Artificial intelligence. Illustration of a brain-shaped printed circuit board.

Depuis déjà quelques années maintenant, l’intelligence artificielle suscite l’intérêt du plus grand nombre et ce dans divers industries. Si vous avez déjà entendu parler de l’Intelligence Artificielle (IA), le terme Computer Vision ne doit pas vous être inconnu.

 

La computer vision en quelque mots…

 

La computer vision, aussi appelée en français la vision par ordinateur ou vision artificielle, est une sous-catégorie de l’IA. Cet ensemble de méthodes et de technologies permet l’automatisation d’une tâche spécifique à partir d’une image. En effet, une machine est capable de détecter, d’analyser et d’interpréter un ou plusieurs éléments d’une image ou d’un flux vidéo. Par conséquence, la machine peut prendre une décision et réaliser une action.

Nous allons nous concentrer sur un domaine spécifique de la computer vision qui est le traitement d’image et tout particulièrement la reconnaissance d’image. Cependant, il existe d’autres disciplines au sein de la Computer Vision telles que la reconnaissance faciale (si le sujet vous intéresse, allez jeter un œil à cette article), de texte ou encore d’iris.

 

Comment cela fonctionne ?

 

Dans une grande majorité des cas, la reconnaissance d’image s’appuie sur le Deep Learning (DL).

Pour ceux qui ne sont pas familiers avec le Deep Learning (ou en français l’apprentissage profond), cela correspond à un ensemble de techniques d’apprentissage automatique. Le DL repose sur un réseau de neurones artificiels, similaire au cerveau humain. A savoir qu’un réseau de neurones est constitué de plusieurs couches successives de neurones. Par ailleurs, en fonction de l’architecture neuronale choisie, chacune de ces couches peut influencer une autre.

 

neural network layers

 

Afin que l’algorithme soit capable de reconnaître une image, il est nécessaire d’entraîner le réseau de neurones au préalable. C’est pourquoi, on lui fournit une base de données qui a d’abord été annotée manuellement selon le type d’information que l’on veut extraire.

 

Pour être performant, le jeu de donnée d’entraînement doit respecter 3 critères significatifs :

  • Quantité. Une base de données riche en image améliorera le taux de performance de l’algorithme.
  • Diversité. Il est nécessaire d’avoir des images variées afin d’habituer l’algorithme à reconnaître les éléments souhaités dans divers situations.
  • Proportionnalité. Par exemple si vous souhaitez que l’algorithme reconnaisse 3 catégories différentes dans votre base de données, il sera important que ces 3 catégories soient proportionnellement représentées, pour permettre un entraînement adéquat.

 

Détection & classification, mais quel est le lien avec la Computer Vision ?

 

La détection d’objets et la classification d’images sont deux notions régulièrement associées à la Computer Vision. En effet, il s’agit de deux tâches que la reconnaissance d’image est capable de réaliser.

Tout d’abord, la détection d’objet consiste à la recherche d’un élément en particuliers et la localisation de son emplacement au sein d’une image, à l’aide d’une “box”. Par ailleurs, il existe une méthode de détection plus élaborée et plus précise (au pixel près), appelée la segmentation qui se fait à l’aide de polygone.

Quant à elle, la classification d’image va permettre d’identifier à quelle catégorie une image appartient, en fonction de sa composition. En d’autres termes, on veut identifier le sujet principale de l’image. Cependant, il est possible d’associer plus d’une catégorie à une image grâce au tagging avec un fonctionnement similaire à la classification.

 

Quelles utilisations peut-on faire de la reconnaissance par ordinateur ?

 

En pratique, la vision par ordinateur va assister les humains dans leur tâches quotidiennes, leur faciliter la détection d’éléments, de comportements, de situations spécifiques… De plus, cela permettrait un gain de temps considérable mais aussi de réduire le taux d’erreurs humaines (et ce même si les machines ne sont pas encore infaillibles !). Par ailleurs, la construction d’innovation de rupture comme la voiture autonome ou encore les objets connectés est désormais possible grâce à la Computer Vision.

Comme vous avez pu le comprendre, la computer vision peut être alors exploitée dans un nombre très large d’industries, aussi bien dans le domaine pharmaceutique et médicale que dans le BTP ou encore l’automobile.

Pour illustrer nos propos, voici un exemple concret d’application: les véhicules autonomes. Grâce à la computer vision, Valeo a pu mettre en place des voitures capable d’adapter automatiquement la températures de l’habitacle en fonction des besoins de chaque passagers. En effet, le passager est analysé en fonction de son sexe et des couches de vêtements qu’il porte. Ce système a été développé en vue d’économiser de l’énergie tout en optimisant l’expérience client.

Si vous êtes curieux d’en savoir plus sur les différents cas d’usages possibles, découvrez ceux sur lesquels nous avons travaillé chez Deepomatic (vidéo surveillance intelligente, encaissement libre, détection de zones dangereuses…) !

Share This