Depuis sa mise en vigueur en mai 2018, le RGPD agit pour le respect de la vie privée des utilisateurs européens en imposant aux entreprises de protéger les données personnelles collectées. En effet, il s’agit de préserver la vie privée des citoyens, en protégeant aussi bien leur nom & prénom que leurs données biométrique. Il existe donc différentes méthodes pour la protection des données, avec en particulier l’anonymisation des données.
L’anonymisation des données, qu’est-ce que c’est ?
L’anonymisation des données est un processus qui consiste en une transformation irréversible des données afin de ne plus avoir la possibilité d’identifier une personne en particuliers. Le terme irréversible sous-entend qu’il ne doit pas être possible de ré-identifier la personne en question, de manière directe ou indirecte.
Il existe, par ailleurs, une dérivée de l’anonymisation appelée la pseudonymisation. Il s’agit aussi d’une transformation des données personnelles qui vise à empêcher l’identification d’une personne. Cependant, l’objectif principale est d’empêcher l’identification directe. C’est-à-dire, qu’il est tout de même possible de ré-identifier une personne en ayant recours à des informations supplémentaires.
La pseudonymisation correspond donc à un traitement de données moins fort que l’anonymisation puisqu’il n’empêche pas totalement et définitivement l’identification d’une personne.
Les méthodes d’anonymisation
Il existe deux grandes techniques d’anonymisation des données:
- la randomisation: transformer les données afin qu’elle ne puisse plus être attribuées à une personne réelle
- la généralisation: généraliser les données afin qu’elles deviennent communes à un ensemble de personnes et non à une personne en particuliers.
Les challenges de l’anonymisation des données
Cependant, les entreprises font face à un volume de données grandissant et de plus en plus difficile à gérer. Avec de larges volumes de données, l’anonymisation semble beaucoup moins efficace. Effectivement, il est plus facile de ré-identifier une personnes par recoupement d’information.
Pour assurer une anonymisation performante, le CNIL(1) estime qu’un jeu de données anonymisées doit respecter 3 critères principaux:
- L’individualisation: est-il toujours possible d’isoler un individu ?En d’autres mots, on ne doit pas être en capacité d’identifier un individu en particuliers.
- La corrélation: est-il possible de relier entre eux des ensembles de données distincts concernant un même individu ? C’est-à-dire que le recoupement d’information ne doit pas être envisageable.
- L’inférence: _peut-on déduire de l’information sur un individu ?_Aucune induction permettant l’identification d’une personne ne doit pouvoir être faite.
Si une de ces 3 conditions n’est pas respectées, le jeu de données sera considéré comme mal anonymisé.
Case Study: RATP & l’anonymisation de flux vidéos
Les solutions d’anonymisation des données doivent être construites au cas par cas; chaque entreprise et industrie a des besoins et des exigences différentes.
Pour illustrer nos propos, voici un exemple concret d’application.
Deepomatic a établi, pour la RATP, un système sur-mesure d’anonymisation du flux vidéo de leurs caméras de vidéosurveillance. En effet, l’anonymisation est réalisée grâce à un module de floutage automatique et ce en temps réel. Cette solution permet un traitement rapide des images et d’assurer la préservation des données personnelles (dans ce cas présent, des données biométriques) des utilisateurs du réseaux de transport parisiens.
Si vous aussi, vous avez un projet d’anonymisation d’images ou de flux vidéos, n’hésitez pas à nous contacter afin d’en discuter.
(1). Le G29 publie un avis sur les techniques d’anonymisation