Pour fonctionner, les algorithmes ont préalablement besoin d’être “éduqués”, c’est-à-dire d’ingérer une grande quantité de données annotées par la main de l’homme. Sans cette intervention, pas d’automatisation.
Cette tâche aussi répétitive que décisive, appelée “annotation”, est généralement externalisée par les entreprises qui entraînent des solutions d’intelligence artificielle. Dans le cadre d’une organisation comme Deepomatic l’annotation est une prestation de service déterminante dans le développement de notre solution.
À l’heure où fleurissent les discours sur la durabilité des chaînes d’approvisionnement ou sur l’éthique de l’intelligence artificielle, l’écosystème a encore beaucoup de mal à considérer l’annotation comme relevant de leur chaîne de responsabilité et à aborder les problématiques qu’elle génère de part le monde.
Chez Deepomatic, nous avons pris le taureau par les cornes et travaillons depuis deux ans à l’amélioration des conditions de travail de celles et ceux qui rendent notre produit possible. Cet article a une double vocation : sensibiliser les curieux à cette question sociale et convaincre les organisations concernées de prendre le problème à bras le corps.
Depuis plus d’une décennie, l’intérêt pour l’éthique de l’intelligence artificielle est en essor : les guides et les labels visant à encadrer la pratique se sont multipliés et les discours unifiés autour de problématiques bien définis : répartition des responsabilités (accountability), protection de la vie privée, sûreté, explicabilité et équité (1)… Cependant, aussi surprenant que cela puisse paraître, quasiment aucune de ces productions ne traite frontalement d’une des externalités principales de cette technologie, c’est-à-dire les petites mains qui, tout à l’extrémité de la chaîne, labellisent les données.
À titre d’exemple, dans son guide de 2019, la Commission européenne fait seulement une toute petite mention de la pratique pour recommander la mise en place d’outils souverains (2). Il y a bien un manque de considération ambiant pour un sujet pourtant déterminant.
La loi sur le devoir de vigilance adoptée en 2017 a créé une obligation pour les entreprises donneurs d’ordre de prévenir les risques sociaux, environnementaux et de gouvernance liés à leurs opérations – mais qui peut aussi s’étendre aux activités de leurs filiales et de leurs partenaires commerciaux. Or, l’externalisation de l’annotation revêt, de par son caractère nouveau, croissant et son manque d’encadrement, des risques humains importants.
En dehors de ces considérations sociales, il faut également souligner que la bonne exécution de cette activité est indissociable de la performance des algorithmes. Mal exécutée, elle les induit en erreur. Aux regards de ces éléments, il est difficile de comprendre le manque d’égard pour cette question incontournable qui lorsqu’elle est abordée se concentre souvent sur les cas extrêmes (mais néanmoins importants !) des travailleurs et travailleuses indépendant(e)s opérant sur des plateformes très peu contrôlée. Or, il existe d’autres formes d’organisations de ce travail qui, comme nous le verrons, posent également question.
En réaction à ce silence généralisé et grâce à quelques lectures éclairantes, Deepomatic a très vite voulu mieux cerner la thématique et mieux connaître celles et ceux qui concourent à sa solution. Après deux années de recherche et d’investigations, nous sommes fiers de pouvoir partager les conclusions que nous avons tirées, les actions que nous avons mises en place et que nous souhaitons promouvoir auprès de toutes et tous.
Les enjeux éthiques de l’annotation
Définition
En langage technique, l’annotation des données est une tâche qui vise à préparer le jeu de données d’entraînement en apprentissage supervisé. Elle consiste à associer des métadonnées à chaque ensemble de données. En langage plus barbare, disons que si vous souhaitez que votre solution de reconnaissance d’image distingue les pommes des poires, il faut préalablement lui montrer des milliers d’images de chacun de ces fruits, labellisées comme tel, avant que la magie n’opère.
Dès lors, on imagine bien pourquoi cette pratique répétitive est par nature chronophage : jusqu’à 80% de temps passé sur un projet d’intelligence artificielle peut consister en cette préparation (3).
C’est un secteur lucratif et en pleine expansion : Les solutions d’annotation ont généré 1,7 milliard de dollars en 2019 et atteindront probablement 4,1 milliards d’ici 2024.
Un système globalisé
La dimension totalement digitalisée de cette activité implique qu’elle peut être pratiquée n’importe où dans le monde, à des tarifs variables, souvent très bas. Assez logiquement, elle est donc fortement marquée géographiquement.
Dans son ensemble, la demande est concentrée dans les pays du Nord, son traitement est quant à lui un peu plus diffus mais se trouve majoritairement réalisé dans les pays du Sud à plus faibles revenus, comme l’Inde ou les Philippines (4).
Des modèles organisationnels variés
Pour absorber un besoin croissant des pays du Nord, un grand nombre de structures proposant des tarifs, un suivi et des niveaux d’engagements variés ont vu le jour, chacune ayant des impacts spécifiques.
Comme dit en introduction, lorsqu’on aborde le sujet de ces travailleurs et travailleuses du digital, on trouve souvent mention de ceux œuvrant sur les open plateform dont Amazon Mechanical Turk est un exemple illustre. Elles se caractérisent par un grand nombre de micro-travailleurs indépendants exerçants des tâches très faiblement rémunérées, de chez eux en toute autonomie matérielle, pour des acteurs souvent multiples. Le contrôle final du travail y est très faible. Toujours sur un modèle de plateforme, on trouve également les deep labor platform où le contrôle et les prix sont intermédiaires.
Ce type de modèle est à distinguer des modèles de Business process outsourcing (BPO) dans lesquels les prix sont sensiblement plus élevés, le contrôle exercé sur le travailleur plus grand, et leur situation plus stable. Dans ce cas, les entreprises externalisent cette activité auprès d’une structure spécialisée. L’équipement et la formation sont à la charge du prestataire. À travers cet article, c’est bien de ce type d’organisation que nous parlerons principalement, mettant donc de côté les problématiques particulières des plateformes d’indépendants, même si les causes se rejoignent à plus d’un titre.
Parallèlement aux entreprises du BPO, on en trouve d’autres qui se sont d’emblée positionnées sur le segment de l’impact sourcing. Elles veulent offrir de meilleures conditions de travail et/ou de meilleures perspectives d’évolution à leur personnel (5). Les travailleurs et travailleuses peuvent être indépendants ou non, les tarifs et le contrôle exercé moyens. On compte parmi leurs rangs des entreprises comme CloudFactory, IMerit ou encore Samasource qui vient de s’illustrer dans un récent scandal avec l’entreprise OpenAI (6). Si la volonté d’un impact social positif est présente, il existe peu de standards permettant de certifier cette dimension.
Les bénéfices économiques
Les entreprises mettant en avant les impacts bénéfiques de cette pratique axent très souvent leurs discours sur l’inclusion économique qu’elles favorisent théoriquement. Sa nature digitale, décentralisée ainsi que le fait qu’elle ne nécessite pas forcément de qualifications préalables faciliterait l’accès à l’emploi formel de personnes en étant a priori éloignées en raison de la situation économique des pays dans lesquels elles se trouvent. Cette faculté à faire pénétrer ces individus dans une économie formelle, loin d’être toujours majoritaire dans les pays à faibles revenus, est un des arguments qui motivent également certains gouvernements à promouvoir ce type de travail digital dans leur pays.
Parmi les autres avantages qui seraient rendus possibles par cette pratique, on trouve l’accès à la flexibilité du travail et au travail à distance. Ce bénéfice est uniquement vrai pour les entreprises où les travailleurs et travailleuses sont réellement indépendants (c’est-à-dire théoriquement pas dans les BPO). Quand c’est le cas, les individus jouissent en effet de la possibilité de travailler où bon leur semble et de moduler la quantité de travail en fonction de leurs besoins.
Aussi reluisants qu’ils puissent avoir l’air, ces impacts sont parfois contrebalancés par d’autres phénomènes qui viennent ternir l’image d’une pratique présentée de manière manichéenne comme émancipatrice.
Les désavantages économiques
Le caractère inédit – et donc, vous l’aurez compris, mal connu – de cette nouvelle forme de travail contribue à créer des difficultés juridiques. Si c’est particulièrement le cas pour les modèles d’open platform, on trouve aussi des problèmes du côté des structures BPO où le salariat déguisé est parfois de mise. Les employés ne bénéficient alors ni des avantages liés aux statuts d’indépendants, ni ceux octroyés par les contrats à durée indéterminée. Ce constat vient fragiliser l’idée de l’insertion de ces individus dans une économie formelle et régulée.
Quand bien même cette activité favoriserait bien l’insertion pour tous, elle offre de toute façon peu de perspectives d’évolution à ceux qui y participent. On peut grimper dans la hiérarchie de l’entreprise mais les strates ne sont pas nombreuses. C’est d’autant plus problématique quand on prend en considération le fait que les travailleurs et travailleuses sont souvent surqualifiés par rapport à la tâche qu’ils ou elles exécutent. Aussi, la majorité des structures ne contribuent pas au développement de l’entreprenariat local en raison de la composition de leur direction et de leurs actionnaires. L’impact social semble donc définitivement à nuancer.
Autre problématique majeure : la répartition de la richesse générée par l’externalisation de cette activité. Les salaires touchés par les employés sont souvent extrêmement faibles, et plus particulièrement dans les pays du Sud. C’est un fait récemment mis en lumière par une enquête du Time au sujet des travailleurs ayant contribué au très discuté ChatGPT. Pour modérer cette intelligence artificielle génératrice de contenu et ainsi éviter qu’elle produise un contenu violent ou inapproprié, les annotateurs étaient payés entre $1,32 et $2 net pour une heure de travail, sachant que le salaire minimum horaire avoisine les $1,52 dans leur pays, le Kenya (7). Samasource, l’entreprise chargée de cette mission par Open AI, a quant à elle touché entre six à sept fois le montant alloué aux travailleurs.
La forte concurrence qui s’exerce entre les travailleurs ne favorise pas l’émergence de revendications pour un salaire minimum collectif ou quelconque autre amélioration de leurs conditions de travail. L’émergence d’une forme de conscience commune et donc d’un pouvoir de négociation collectif (8) n’est ni facile ni facilitée et la défense de droits essentiels n’est pas assurée par une institution reconnue. Ce manque de représentativité empêche également l’émergence d’un standard international qui permettrait de situer les entreprises par rapport à leurs impacts sociaux et de les certifier.
Ainsi, s’il existe indéniablement des effets positifs à ce phénomène d’externalisation, il faut les mettre en balance avec les effets moins reluisants. Chez Deepomatic, nous pensons que ces ambiguïtés doivent impérativement être connues de tous ceux et celles qui souhaitent externaliser un service similaire.
Ce que peuvent faire les entreprises
« « Organizations committed to transparency and identifying best practices could do much to improve working conditions. » (9) »
Malgré le manque cruel d’intérêt pour la question, des frémissements commencent à se faire sentir et certains acteurs de l’écosystème tech s’approprient la question : Partnership on AI (PAI) a par exemple produit tout une série d’outils et de documents concernant les “data enrichment workers” à destination des praticiens de l’IA (10). Eux aussi insistent sur le rôle déterminant des professionnels sur les conditions de travail. Le Data Enrichment Sourcing Guidelines propose notamment cinq mesures concrètes pour améliorer le contexte de travail des travailleurs et travailleuses (11).
Si leurs recommandations sont remarquablement opérationnelles, elles semblent plutôt s’adresser à des acteurs faisant appel à des plateformes. À ce titre, les recommandations qu’ils formulent divergent par certains points des nôtres. Cependant, beaucoup d’éléments restent communs et montrent qu’une préoccupation commune est en cours d’émergence. Une dynamique positive, un changement profond, est indéniablement en cours.
Le contexte de Deepomatic
Chez Deepomatic, notre choix s’est porté sur une petite structure, assimilable au modèle BPO, et qui a la particularité d’être dirigée par une entrepreneuse locale. L’impact n’était initialement pas au cœur de son modèle. C’est la raison pour laquelle nous avons tenu à nous assurer de la qualité des conditions de travail et à mener, main dans la main, un processus d’amélioration de celles-ci. Il nous a paru plus pertinent et éthiquement plus impactant d’œuvrer à l’amélioration de cette structure plutôt que de migrer d’emblée vers une autre organisation.
Ce travail d’accompagnement a nécessité une grande réflexion de notre côté pour déterminer quelles étaient nos exigences en la matière (et qui devraient selon nous être le minimum requis par tous les donneurs d’ordre). En sont ressortis plusieurs enseignements que nous souhaitons partager ici dans l’optique qu’ils deviennent des critères de choix pour tous.
Comprendre à la fois les enjeux globaux et spécifiques de l’activité
Chaque activité impacte fatalement l’écosystème dans lequel elle se déroule. Pour limiter les négatives et favoriser les positives, il paraît nécessaire dans un premier temps d’essayer d’y voir clair, de bien conceptualiser les tenants et les aboutissants de l’activité en question.
Il faut d’abord s’atteler à comprendre les enjeux globaux. La première partie de cet article fait état de certains des enjeux principaux liés à l’émergence du marché de l’annotation mais la liste est loin d’être exhaustive. C’est pourquoi nous recommandons à tout à chacun d’approfondir sa connaissance des impacts par autant de lecture que possible.
Une fois ces enjeux bien saisis, il est pertinent de se pencher sur les enjeux spécifiques qui peuvent être liés à votre activité propre. En effet, les types de données que l’on cherche à faire étiqueter peuvent être de nature diverses et n’ont pas toutes les mêmes conséquences sur les travailleurs. À titre d’exemple, faire labelliser du contenu sensible et violent – comme dans le cas du travail effectué pour le ChatGPT – implique un besoin plus pressant d’accompagnement psychologique pour les travailleurs. Dans un cas similaire, il faut donc veiller à ce que la structure intermédiaire en propose un de qualité.
Cependant, trouver mention d’une cellule d’accompagnement dans une brochure n’est pas toujours une garantie suffisante. Pour cette raison, nous encourageons toute organisation qui noue un partenariat long-terme avec une structure d’annotation à mener une enquête de terrain. Celle-ci peut prendre différentes formes.
Ce que l’on a fait : Chez Deepomatic, nous avons eu la chance de pouvoir participer à une recherche académique à orientation sociologique. Dans ce cadre, des chercheurs ont été amenés à rencontrer l’équipe avec laquelle nous travaillons pour faire un état des lieux de leurs conditions de travail. Connaître avec précision les conditions matérielles de travail et le parcours de nos travailleurs nous a permis d’orienter nos actions. Cette occasion étant somme toute peu commune, une étude peut être plus classiquement menée par des auditeurs spécialisés en management de supply chain.
Veiller à la juste rémunération
On l’a vu, les salaires des travailleurs avoisinent souvent les salaires minimum de base (lorsqu’il y en a) des pays dans lesquels ils se trouvent et il arrive aussi que les structures intermédiaires captent une grande partie de la valeur générée sans pour autant fournir à leurs travailleurs les conditions matérielles nécessaires à l’exécution de leurs tâches.
Il faut donc interroger les structures au sujet de la répartition de la valeur et comprendre très concrètement ce qu’un travailleur ou une travailleuse a dans la poche à la fin du mois. Cette interrogation doit être mise en perspective avec les salaires minimum des localités où se déroule l’activité.
Le simple fait de se renseigner sur cette dimension est déjà un acte vertueux en soi : en sollicitant les acteurs avec lesquels on pourrait collaborer à ce sujet, on crée la même dynamique que lorsqu’on interroge son fournisseur sur son impact carbone, c’est-à-dire qu’on fait comprendre que c’est un facteur important dans la prise de décision.
Mais il est possible – et recommandé – d’aller loin encore en œuvrant pour leur accroissement quand ils sont jugés trop bas. Cependant, il faut insister ici sur le calcul du salaire équitable n’a rien d’évident et doit se baser sur des éléments tangibles. On peut raisonner à partir du salaire minimum en vigueur quand il y en a, ou à partir d’une estimation du salaire de subsistance nécessaire (12). À noter que ces salaires peuvent varier à l’intérieur d’un même pays et doivent être actualisés périodiquement. En somme, c’est un sujet qui pose des questions et sur lequel on gagnerait à avoir une méthodologie collective et précise.
Ce que l’on a fait : Deepomatic a par exemple fait le choix d’augmenter le salaire de base (c’est-à-dire hors primes et compensations) de toutes les personnes travaillant pour son compte pour s’assurer qu’il soit au moins deux fois plus élevé que le salaire minimum de base local à entrée de poste.
Faire prévaloir la stabilité de l’emploi
On l’a vu, une grande partie des structures d’annotation proposent et mettent en avant les vertus du statut d’indépendant. Pourtant, il n’est pas toujours le gage pérenne d’une insertion dans l’économie formelle, surtout lorsque l’employé ne dispose pas d’autres perspectives.
Pour la favoriser, nous pensons qu’il faut offrir aux travailleurs une certaine stabilité que seuls les équivalents de contrat à durée indéterminée permettent réellement sur le temps long. En plus de permettre l’accès à des revenus stables, ils permettent de bénéficier des avantages sociaux qui peuvent contribuer à une meilleure santé, à une plus grande sérénité et donc une meilleure insertion.
Autre point important, le salariat octroie un droit de représentation du personnel contrairement au statut indépendant. Cela permet d’unir et de faire remonter les revendications, qui autrement ont du mal à être formalisées et transmises, auprès de l’employeur.
Ce que l’on a fait : Dans notre cas, nous avons travaillé en collaboration avec notre prestataire à un changement de type de contrat, les faisant passer du statut de travailleurs indépendants à celui de salarié, afin que tous les travailleurs puissent disposer des avantages liés à la stabilité de l’emploi comme la retraite et une couverture santé.
Donner de la perspective
En raison du caractère répétitif et morcelé de la tâche à exécuter, il n’est pas toujours évident pour celui ou celle qui s’y colle de comprendre la valeur de sa production. De plus, les entreprises donneuses d’ordre ne font que trop rarement un effort de contextualisation qui permettrait pourtant aux travailleurs de mieux cerner où se trouve son travail sur la chaîne de création de valeur et donc de valoriser sa contribution.
Mais ce n’est pas la seule perspective dont ils semblent manquer. Peu d’employés interrogés dans le cadre de l’étude de notre prestataire se projettent à long terme dans cette activité. Ils voient majoritairement ça comme une transition sans pour autant avoir une idée de la manière dont ils pourraient évoluer par la suite. Il faut donc nourrir leurs perspectives d’évolution.
Ce que nous allons faire : Pour palier – toute proportion gardée – à ces manques aigus de perspective, Deepomatic pense proposer (sous une forme qui reste à définir) un accès gratuit à des formations relatives au secteur technologique. Cet effort devra aller de pair avec la possibilité d’aménager ses horaires pour passer d’éventuels examens. Pour le moment, cette perspective reste très hypothétique et nous sommes preneurs de retours et de suggestions.
Quant aux actions qui pourraient permettre de donner une perspective plus immédiate sur le produit auquel ils concourent, nous souhaitons organiser des missions d’information qui pourront prendre la forme d’intervention orale ou de documents écrits. Le but étant d’y donner les éléments qui permettent la compréhension de notre solution de computer vision et le public auquel elle s’adresser.
Fédérer les acteurs de la technologie
On l’a vu, il n’y a que très peu de lignes directrices spécifiques à la question de l’annotation, à l’exception de celles de Partnership on AI. La réflexion qu’ils ont initiée est pertinente mais peut tout à fait être alimentée par de nouvelles perspectives de réflexions ou d’autres ambitions.
Par exemple, on pourrait envisager la création d’un consortium pour définir les critères d’un futur label Fair data work. Ces critères pourraient être partager et potentiellement servir de base à une future convention collective des travailleurs et travailleuses de la donnée.
C’est un programme ambitieux dont les contours restent à définir mais susceptible de faire bouger les lignes à grande échelle. Si vous êtes concernés et souhaitez en savoir plus, n’hésitez pas à écrire à l’adresse julie.trinckvel@deepomatic.com.
Le mot de la fin
Parmi les buts fondamentaux poursuivis par Deepomatic, on trouve celui d’apporter plus de visibilité à nos clients. C’est un principe qui ne se circonscrit pas à notre activité commerciale et que nous étendons volontiers à des sujets environnementaux et en l’occurrence sociaux. À ce titre, le premier objectif de cet article est bien de mettre la lumière sur les problématiques engendrées par cette activité.
Ce qu’il est essentiel de retenir en ce sens, c’est que le regard porté sur le travail de la donnée est paradoxal : l’activité suscite peu d’intérêt alors même qu’elle est décisive dans la qualité des algorithmes. C’est la grande oubliée, à la fois des spécialistes du Numérique Responsable qui parlent volontiers de l’impact des solutions sur les usagers finaux mais pas sur les individus qui se trouvent en amont, des spécialistes d’éthique de l’intelligence artificielle qui tendent à se focaliser sur des questions exclusivement techniques et par les services RSE pourtant supposément sensibles à la durabilité des chaînes d’approvisionnement.
Nous espérons que ce constat donnera envie aux praticiens de l’IA et à tout son écosystème d’agir. Les recommandations que nous avons formulé ne sont que les esquisses d’un mouvement que nous souhaitons voir grandir et dépasser les frontières de notre organisation.
Si vous ne voulez pas rester en marge du changement, rejoignez-nous !
Notes(1) Hagendorff Thilo, “Blind spots in AI ethics”, AI and Ethics 2, December 2021. Même constant dans Tessier Catherine, Éthique et IA : analyse et discussion, CNIA 2021 : Conférence Nationale en Intelligence Artificielle, Juin 2021. T. Hagendorff ajoute que si ces considérations polarisent les discussions sur l’éthique de l’IA, c’est en raison du fait que ces problématiques peuvent être résolues techniquement : “AI ethics often frames AI applications as isolated technical artefacts or entities that can be optimized by experts who apply technical solutions to technical problems that are depicted as problems of ethical AI. Contrary to this position, this paper argues that AI applications must not be conceived in isolation but within a larger network of social and ecological dependencies and relationships.”
(2) High-Level Expert Group on Artificial Intelligence. Policy and Investment Recommendations for Trustworthy AI. Commission européenne, 2019.
(3) Data Engineering, Preparation, and Labeling for AI 2020, Cognilytica Research, 2020.
(4) Graham Mark, Hjorth Isis, Lehdonvirta Vili, “Digital labour and development: impacts of global digital labour plaforms and the gig economy on worker livelihoods”, Transfer: European Review of Labour and Research, 2017.
(5) Kaye Kate, “These companies claim to provide “fair-trade” data work. Do they?”, MIT Technology Review, 2019.
(6) Zorthian Julia, “Exclusive: OpenAI Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic”, Time, 2023.
(7) Ibid.
(8) Graham Mark, Hjorth Isis, Lehdonvirta Vili, “Digital labour and development: impacts of global digital labour plaforms and the gig economy on worker livelihoods », op. cit.
(9) Ibid.
(10) Toutes les ressources produites à ce sujet sont disponibles ici.
(11) Data Enrichment Sourcing Guidelines, Partnership on AI, 2022.
(12) Il est par exemple possible d’accéder à des études spécialisées depuis l’outil IDH Recognized Living Wage Benchmarks.