Souvent utilisée à mauvais escient, l’expression “identification d’images” semble de plus en plus répandue. Par définition, l’identification d’image permet d’identifier et de discerner la nature d’une image ou ses composantes. Cependant, cela ne correspond pas spécifiquement à concept scientifique ou informatique; il manque de précision.
L’identification d’images n’existe donc pas réellement.
Si l’utilisation du terme “identification d’images” n’est peut être pas appropriée, elle se réfère pourtant bien à une idée de vision par ordinateur. Il est possible, grâce à la computer vision, de reconnaître la nature d’une image ou ce qu’elle représente et de pouvoir ainsi proposer des contenus similaires. En effet, il existe différentes sous-catégories de la Computer Vision permettant de réaliser ce type de tâches telles que la Visual Search ou la reconnaissance d’images.
Visual Search – une image vaut mille mots
Nous pouvons considérer que l’identification d’images est intimement liée à la Visual Search puisqu’elle permet de retrouver la provenance d’une image ou bien de proposer des contenus similaires à cette image.
Vous ne vous êtes jamais demandé comment un site internet pouvait vous proposer des articles que vous pourriez potentiellement aimer ? La réponse est la suivante: la Visual Search. Effectivement, le E-commerce, en particuliers dans l’industrie de la mode, exploite de plus en plus la Visual Search pour offrir des expériences clients plus personnalisées. Il est désormais possible de proposer aux clients des suggestions d’articles par thématique ou par style par rapport aux fiches produits précédemment consultées.
La Visual Search, aussi appelée moteur de recherche visuel en français, effectue des recherches sur internet à partir d’une image. Cela fonctionne avec tous types d’images tels que des screenshots, des images d’internets ou encore des photos.
Pour vous aider à comprendre le principe, prenons un exemple concret. Il existe de nombreuses plateformes de Visual Search, la plus connue étant Google Images.
Faisons une simulation d’utilisation de Google Images. Vous décidez d’entrer une image de voiture rouge, importée depuis votre ordinateur. Google va ensuite vous proposer une recherche associée possible, un ensemble d’images similaires et enfin les pages contenant des images identiques à la vôtre. Cette liste de suggestions est faite par rapport à un certain nombres de critères: couleurs, formes, motifs..
Autre exemple de moteur de recherche innovant: TinEye. Fonctionnant lui aussi grâce à la Visual Search, son but est de retrouver la provenance d’une image en vous fournissant les pages où elle apparaît. Son utilisation est très simple. Il suffit de télécharger votre image dans la barre de recherche comme pour Google et vous découvrirez alors la liste de pages dans lesquelles votre image figure.
Image Recognition – une image vaut mille labels
Dans l’esprit collectif, en addition à la Visual Search, l’identification d’images semble souvent être associée à la reconnaissance d’images.
La reconnaissance d’images, sous-catégorie de la computer vision, consiste en un ensemble de méthodes de détection et d’analyse d’images pour permettre l’automatisation d’une tâche spécifique.
Pour que la reconnaissance d’images soit performante, il est nécessaire d’entraîner les réseaux de neurones d’un algorithme à partir d’une base de donnée annotée. Des réseaux de neurones entraînés à reconnaître plusieurs milliers de labels et d’objets sont disponibles en ligne, comme par exemple:
Prenons donc l’exemple du portail Clarifai pour illustrer nos propos. Il vous est possible de faire des recherches par concept, par image, par métadonnée ou encore par géolocalisation (les possibilités sont de plus en plus variées!). Dans la cas présent, nous ne nous intéresserons qu’à la recherche par image.
L’idée est simple: le plateforme possède une base de donnée d’images classée par concepts. Clarifai vous propose une liste de 10 concepts différents afin de pouvoir tester l’efficacité de l’algorithme. Nous avons décidé de choisir le concept “siamese cats” (chats siamois en français). Il suffit maintenant de télécharger une image de chat siamois dans la barre de recherche afin d’obtenir toutes les images similaires. Ce résultat se réfère aux labels attribués aux différentes images de la base de données.
Pour conclure, l’identification d’images renvoie, dans la majorité des cas, à la computer vision et en particulier à la visual search et la reconnaissance d’images. Cependant, il est important de garder à l’esprit qu’il ne s’agit pas d’une appellation scientifique homologuée.
Si le sujet a attisé votre curiosité et vous souhaitez comprendre davantage le monde de la computer vision et plus particulièrement de la reconnaissance d’images, visitez notre blog !