Publicado el

Anotación de Datos: Deepomatic y la Ética en la Inteligencia Artificial

Para funcionar, los algoritmos necesitan ser " instruidos " es decir, procesar una gran cantidad de datos etiquetados por la mano humana. Sin esta intervención, no es posible su automatización. Esta tarea repetitiva, pero decisiva, llamada “anotación”, suele ser subcontratada por empresas que entrenan soluciones de inteligencia artificial. Para una organización como Deepomatic, la anotación es un servicio clave en el desarrollo de su solución. Se suele hablar sobre la sostenibilidad de las cadenas de suministro y la ética de la inteligencia artificial, el ecosistema aún se esfuerza por ver la anotación como parte de su cadena de responsabilidad y por abordar los problemas que genera en todo el mundo. En Deepomatic nos hemos tomado las cosas muy en serio y llevamos dos años trabajando para mejorar las condiciones laborales de quienes hacen posible nuestro producto. Este artículo tiene una doble finalidad: Sensibilizar a los curiosos sobre este problema social y convencer a las organizaciones implicadas para que aborden el problema con seriedad y determinación.

Desde hace más de una década, el interés por la ética de la inteligencia artificial está en auge: se han multiplicado las guías y etiquetas destinadas a enmarcar la práctica y se han unificado los discursos en torno a cuestiones bien definidas: responsabilidad, privacidad, seguridad, aplicabilidad y equidad (1). Sin embargo, por sorprendente que parezca, casi ninguna de estas producciones aborda directamente una de las principales externalidades de esta tecnología, es decir, los trabajadores que, al principio de la cadena, etiquetan los datos.

Por ejemplo, en su guía de 2019, la Comisión Europea solo hace una pequeña alusión a la práctica de recomendar la aplicación de soluciones soberanas (2). Ciertamente, hay una falta de consideración general hacia este tema tan fundamental.

La ley europea sobre el “Deber de vigilancia”, aprobada en 2017, señaló a las empresas “encargadas” la obligación de prevenir los riesgos sociales, medioambientales y de gobernanza relacionados con sus operaciones – pero que también puede extenderse a las actividades de sus filiales y socios comerciales. Sin embargo, debido a su carácter nuevo, creciente y aunando a esto su falta de supervisión,  la externalización de la anotación implica importantes riesgos humanos. 

Además de estas consideraciones sociales, También hay que destacar que la correcta ejecución de esta actividad está directamente vinculada al rendimiento de los algoritmos. Puesto que si está mal ejecutada, les induce a error. Entonces resulta difícil entender la falta de atención prestada a esta cuestión clave, que cuando llega a ser abordada, suele centrarse en los casos extremos (¡aunque no por ello menos importantes!) de los trabajadores autónomos que operan en plataformas muy poco controladas. Pero hay otras formas de organización del trabajo que, como veremos, también plantean interrogantes.

Como respuesta a este silencio generalizado y gracias a algunas lecturas reveladoras, Deepomatic rápidamente quiso adentrarse al problema y acercarse a aquellos que contribuyen a su solución. Tras dos años de búsqueda e investigación, nos complace compartir las conclusiones a las que hemos llegado, las acciones que hemos puesto en marcha y que deseamos impulsar entre todos.

Cuestiones éticas de las anotaciones

Definición

En términos técnicos, la anotación de datos es una tarea cuyo objetivo es preparar el conjunto de datos de entrenamiento para el aprendizaje supervisado. Consiste en asociar metadatos a cada conjunto de datos. En un lenguaje menos ortodoxo, digamos que, si quiere que su solución de reconocimiento de imágenes distinga peras de manzanas, tienes que mostrarle miles de imágenes de cada una de estas frutas, etiquetadas como tales, antes de que se produzca la magia. Así que es fácil ver por qué esta práctica repetitiva consume naturalmente tanto tiempo: hasta el 80% del tiempo dedicado a un proyecto de inteligencia artificial puede consistir en esta preparación (3). 

Es una industria rentable y en crecimiento: las soluciones de anotación generaron 1.700 millones de dólares en 2019 y es probable que alcancen los 4.100 millones de dólares en 2024.

Un sistema globalizado

La dimensión totalmente digitalizada de esta actividad permite practicarla en cualquier lugar del mundo, a tarifas variables, a menudo muy bajas. Lógicamente, está muy marcada geográficamente. 

En conjunto, la demanda se concentra en los países del Norte, mientras que su tratamiento es un poco más difuso, pero se realiza principalmente en los países del Sur con ingresos más bajas, como India o Filipinas (4).

Diversos modelos organizativos

Para responder a una necesidad creciente en el Norte, se han creado un gran número de estructuras con tarifas variables, de seguimiento y niveles de compromiso, cada uno con repercusiones específicas. 

Como se mencionó en la introducción, cuando hablamos de estos trabajadores digitales, a menudo encontramos mención a los que trabajan en plataformas abiertas, como por ejemplo Amazon Mechanical Turk.Estas plataformas abiertas se caracterizan por un gran número de pequeños trabajadores independientes que realizan tareas muy poco remuneradas, desde sus casas, en completa autonomía material, para numerosos agentes. El control final de las obras es muy escaso. Aunque siguen basándose en un modelo de plataforma, también existen las “deep labor platform”, en la que el control y los precios son de carácter intermedio.

Este tipo de modelo se distingue de modelos como Subcontratación de Procesos de Negocios (BPO por sus siglas en inglés) en el que los precios son significativamente más altos, el control sobre el trabajo efectuado es más importante y la situación de los trabajadores es más estable. En este caso, las empresas subcontratan esta actividad a una estructura especializada. El equipamiento y la formación corren a cargo del proveedor. En este artículo hablaremos principalmente de este tipo de organización, dejando a un lado los problemas típicos de las plataformas independientes, aunque las causas sean similares en muchos aspectos. 

Además de las empresas de BPO, hay otras que se han posicionado en el segmento de la contratación por impacto. Quieren ofrecer mejores condiciones de trabajo y/o mejores oportunidades de desarrollo a su personal (5). Los trabajadores pueden ser independientes o no, las tarifas y el control ejercido son medios. Entre sus filas se encuentran empresas como CloudFactory, IMerit o Samasource, que acaba de hacerse famosa en un reciente escándalo con la empresa OpenAI (6). Si existe la voluntad de generar un impacto social positivo, entonces existen pocas normas que permitan certificar esta dimensión.

Los beneficios económicos

Las empresas que destacan los efectos beneficiosos de esta práctica se centran, con más frecuencia, en la inclusión económica que teóricamente promueven. Su carácter digital y descentralizado, así como el hecho de no requerir necesariamente cualificación previa, facilita el acceso al empleo formal a personas usualmente excluidas por la situación económica de los países en los que se ubican. Esta capacidad de incorporar a estas personas a la economía formal, que dista mucho de ser siempre mayoritaria en los países de bajos ingresos, es uno de los argumentos que motivan a ciertos gobiernos a promover este tipo de trabajo digital en sus países.

Otros beneficios que se obtendrían con esta práctica son el acceso al trabajo flexible y el teletrabajo. Esta ventaja es únicamente  válida para las empresas en las que los trabajadores son realmente independientes (es decir, teóricamente no en BPO). Cuando es así, los individuos disfrutan de la posibilidad de trabajar desde donde quieran, así como también de modular la cantidad de trabajo en función de sus necesidades.

Por muy llamativos que parezcan, estos impactos se ven a veces contrarrestados por otros fenómenos que deterioran la imagen de esta práctica que se presenta, de forma que tiende a reducir la realidad a una oposición radical entre lo bueno y lo malo.

Desventajas económicas

Un hecho sin precedentes – y, por lo tanto, poco conocidos – La naturaleza de esta nueva forma de trabajo contribuye a crear dificultades jurídicas. Si este es particularmente el caso de los modelos de plataforma abierta, también hay problemas con las estructuras de BPO en las que el "empleo ficticio" a veces es la norma. Los trabajadores por cuenta ajena no se benefician de las ventajas del estatuto de autónomo ni de las de los contratos indefinidos. Esta observación desvirtúa la idea de que estas personas están integradas en una economía formal y regulada. Aunque esta actividad favoreciera la integración de todos, ofrece en cualquier caso pocas perspectivas de evolución a quienes participan en ella. Es posible ascender en la estructura jerárquica de la empresa, pero no hay muchos niveles. Esto es aún más problemático si se tiene en cuenta que los trabajadores suelen estar sobre cualificados para la tarea que desarrollan. demás, la mayoría de las estructuras no contribuyen al desarrollo del empresariado local debido a la composición de sus directivos y accionistas. Por lo tanto, el impacto social parece definitivamente atenuado. Otro problema importante es la distribución de la riqueza generada por la externalización de esta actividad. Los salarios que reciben los empleados suelen ser extremadamente bajos, sobre todo en el Sur. Este es un hecho que ha puesto de relieve recientemente una encuesta de Time sobre los trabajadores que contribuyeron al muy discutido ChatGPT. Para moderar esta inteligencia artificial generadora de contenidos y evitar así que produzca contenidos violentos o inapropiados, los anotadores cobraron entre 1,32 y 2 dólares netos por una hora de trabajo, sabiendo que el salario mínimo por hora ronda los 1,52 $ en su país, Kenia (7). Samasource, la empresa contratada por Open AI, cobró entre seis y siete veces la cantidad asignada a los trabajadores.

La fuerte competencia entre los trabajadores no favorece la aparición de reivindicaciones de un salario mínimo colectivo o de cualquier otra mejora de sus condiciones laborales. a aparición de una forma de conciencia común y, por tanto, de un poder de negociación colectiva (8) no es fácil ni se ve facilitada, y la defensa de los derechos fundamentales no está garantizada por una institución reconocida. Esta falta de representatividad impide también la aparición de una norma internacional que permita situar a las empresas en relación con sus impactos sociales y certificarlas.

Así pues, aunque es innegable que este fenómeno de externalización tiene efectos positivos, estos deben equilibrarse con los efectos menos positivos. En Deepomatic creemos que estas ambigüedades deben ser conocidas por todos aquellos que deseen externalizar un servicio similar.

Qué pueden hacer las empresas

« “Las organizaciones comprometidas con la transparencia y el ejercicio de buenas prácticas podrían hacer mucho para mejorar las condiciones de trabajo.” (9) »

A pesar del escaso interés que suscita el tema, hay indicios de que algunos agentes del ecosistema tecnológico están empezando a abordar la cuestión: por ejemplo, la Colaboración en IA (PAI) ha elaborado toda una serie de herramientas y documentos sobre "trabajadores de enriquecimiento de datos" para profesionales de la IA (10). También destacan el papel decisivo de los profesionales en sus condiciones laborales. En concreto, las Directrices de Abastecimiento para el Enriquecimiento de Datos proponen cinco medidas concretas para mejorar las condiciones laborales de los trabajadores (11). Aunque sus recomendaciones son notablemente operativas, parecen estar más dirigidas a los actores que utilizan plataformas. Como tales, sus recomendaciones difieren en algunos aspectos de las nuestras. Sin embargo, muchos elementos siguen siendo comunes y muestran que está surgiendo una preocupación compartida. Es indudable que se está produciendo una dinámica positiva, un cambio profundo.

Contexto de Deepomatic

En Deepomatic, elegimos una estructura pequeña, comparable al modelo BPO, y que tiene la particularidad de estar dirigida por una empresaria local. El impacto no estaba inicialmente en el eje de su modelo. Por eso quisimos asegurar la calidad de las condiciones de trabajo y liderar, de la mano, un proceso de mejora. Nos parecía más oportuno y éticamente más impactante trabajar en la mejora de esta estructura que migrar de inmediato a otra organización. Este trabajo de apoyo ha requerido una gran reflexión por nuestra parte para determinar cuáles eran nuestros requisitos en este ámbito (y cuáles consideramos que deberían ser los mínimos exigidos por todos los clientes). De este trabajo han surgido varias lecciones que nos gustaría compartir aquí con el objetivo de que sean criterios clave para todos.

Comprender los problemas globales y específicos de la actividad

Cada actividad impacta inevitablemente en el ecosistema en la que se desarrolla. Para limitar los impactos negativos y fomentar los positivos, parece necesario primero intentar ver con claridad, conceptualizar los entresijos de la actividad en cuestión. 

En primer lugar, debemos comprender los problemas globales. En la primera parte de este artículo se abordan algunas de las principales cuestiones relacionadas con la aparición del mercado de las anotaciones, pero la lista esta lejos de ser exhaustiva. Por eso le recomendamos incrementar sus conocimientos sobre los impactos leyendo lo más posible. 

Una vez comprendidas estas cuestiones, es pertinente examinar las cuestiones específicas que pueden estar relacionadas con su propia actividad. En efecto, los tipos de datos que se pretende sean etiquetados, pueden ser de naturaleza diversa y no todos tienen las mismas consecuencias para los trabajadores. Por ejemplo, etiquetar los contenidos delicados y violentos – como en el caso del trabajo realizado para ChatGPT – implica una necesidad urgente de apoyo psicológico para los trabajadores. En consecuencia, es importante garantizar que la estructura intermediaria ofrezca un apoyo psicológico de calidad.

Sin embargo, mencionar una célula de apoyo en un folleto no siempre es garantía suficiente. Por este motivo, animamos a cualquier organización que esté colaborando a largo plazo con una organización de anotación a llevar a cabo un estudio de campo. Éste puede realizarse de varias formas.

Lo que hemos hecho: En Deepomatic tuvimos la suerte de poder participar en una investigación académica de sociológia. En este contexto, los investigadores se reunieron con el equipo con el que trabajamos para hacer el balance de sus condiciones de trabajo. El conocimiento preciso de las condiciones materiales de trabajo y de las trayectorias profesionales de nuestros trabajadores nos permitió orientar nuestras acciones. Al tratarse de una oportunidad poco habitual, es posible realizar un estudio de forma más convencional a través de auditores especializados en la gestión de la cadena de suministro.

Garantizar una remuneración justa

Como hemos visto, los salarios de los trabajadores se acercan a menudo a los salarios mínimos básicos (cuando éstos existen) de los países en los que trabajan, y también ocurre que las estructuras intermediarias se apropian de una gran parte del valor generado sin proporcionar a sus trabajadores las condiciones materiales que necesitan para llevar a cabo sus tareas.

Por lo tanto, hay que preguntar a las mismas estructuras sobre la distribución del valor y comprender concretamente lo que un trabajador tiene en su bolsillo a finales de mes. Esta pregunta hay que ponerla en perspectiva con los salarios mínimos de las localidades donde se ejerce la actividad.

El simple hecho de informarse sobre este aspecto ya es un acto beneficioso en sí mismo: al consultar a los agentes con los que podría colaborar en este tema, se crea la misma dinámica que cuando pregunta a su proveedor sobre su impacto en el carbono, es decir, deja claro que se trata de un factor importante en el proceso de toma de decisiones.

Pero es posible - y recomendable - ir más allá y trabajar para aumentarlos cuando se consideren demasiado bajos. Sin embargo, hay que subrayar aquí que el cálculo de un salario justo no es nada evidente, y debe basarse en elementos tangibles. Puede calcularse en función del salario mínimo vigente, o en función de una estimación del salario necesario (12). Hay que tener en cuenta que estos salarios pueden variar dentro de un mismo país y deben actualizarse periódicamente. En resumen, se trata de un tema que plantea dudas y sobre el que nos beneficiaríamos de una metodología colectiva y precisa.

Lo que hicimos: Deepomatic decidió, por ejemplo, aumentar el salario base (es decir, excluyendo primas e indemnizaciones) de todas las personas que trabajaban por cuenta propia para garantizar que fuera al menos el doble del salario base mínimo de entrada local.

Garantizar la estabilidad laboral

Como hemos visto, un gran número de estructuras de anotación proponen y promueven las virtudes del estatuto de trabajador autónomo. Sin embargo, no siempre es una garantía de inserción en la economía formal a largo plazo, sobre todo cuando el trabajador no tiene otras salidas.

Para favorecerla, creemos que es necesario ofrecer a los trabajadores un grado de estabilidad equivalente al de un contrato permanente. Además de dar acceso a ingresos estables, aportan beneficios sociales que pueden contribuir a mejorar la salud, la tranquilidad y, por tanto, la inserción

Otro punto importante es que, a diferencia del estatuto de trabajador autónomo, el de asalariado le da derecho a representación del personal. Esto permite unirse y plantearle al empleador peticiones que, de otro modo, serían difíciles de formalizar y transmitir.

Lo que hicimos: en nuestro caso, trabajamos con nuestro proveedor de servicios para cambiar el tipo de contrato, pasándolo de autónomo a asalariado, de modo que todos los trabajadores pudieran disfrutar de los beneficios asociados a un empleo estable, como pensiones y seguro médico.

Dar perspectiva

Debido al carácter repetitivo y fragmentario de las tareas, no siempre es fácil para el trabajador comprender el valor de lo que produce. Además, las empresas que hacen los pedidos se esfuerzan rara vez por contextualizar su trabajo, algo que permitiría a los trabajadores comprender mejor dónde encaja su trabajo en la cadena de creación de valor y, por tanto, valorizar su contribución.

Pero ésta no es la única óptica de la que parecen carecer. Pocos son los empleados entrevistados en el estudio de nuestro proveedor de servicios, que se ven en esta actividad a largo plazo. En su mayoría, lo ven como una transición, sin tener ni idea de cómo pueden evolucionar después. Por tanto, hay que alimentar sus posibilidades de crecimiento

Qué vamos a hacer: Para compensar -en toda proporción- estas agudas carencias, Deepomatic tiene previsto ofrecer acceso gratuito a cursos de formación en el sector tecnológico. Este esfuerzo tendrá que ir acompañado de la posibilidad de ajustar el horario para presentarse a cualquier examen. Por el momento, esta idea sigue siendo muy hipotética, por lo que agradeceremos cualquier comentario o sugerencia.

En cuanto a las acciones que podrían aportar una visión más inmediata del producto al que contribuyen, nos gustaría organizar misiones de información que podrían adoptar la forma de presentaciones orales o documentos escritos. El objetivo es proporcionar la información necesaria para comprender nuestra solución de Computer Vision y el público al que va dirigida.

Reunir a los agentes tecnológicos

Tal y como hemos visto, existen muy pocas directrices específicas sobre la anotación, a excepción de las de Partnership on AI. La reflexión que han iniciado es pertinente, pero podría verse alimentada por nuevas ópticas u otras ambiciones.

Por ejemplo, podríamos pensar en la creación de un consorcio para definir los criterios de una futura etiqueta Fair Data Work. Estos criterios podrían compartirse y servir potencialmente de base para un futuro convenio colectivo de los trabajadores de datos.

Es un programa ambicioso, cuyos contornos aún están por definir, pero que tiene el potencial de sacudir las cosas a gran escala. Si le preocupa y quiere saber más, escríbanos a julie.trinckvel@deepomatic.com.

Conclusion

Uno de los objetivos fundamentales de Deepomatic es aportar mayor visibilidad a nuestros clientes. Es un objetivo que no se limita a nuestra actividad comercial y que nos gusta extender a las temáticas medioambientales y, en este caso, sociales. Por ello, el objetivo principal de este artículo es arrojar luz sobre las cuestiones que genera esta actividad.

Lo más importante es recordar aquí que la percepción que se tiene del tratamiento de datos es paradójica: esta actividad despierta poco interés, a pesar de desempeñar un papel decisivo en la calidad de los algoritmos. Es la gran olvidada, tanto por los especialistas en Responsible Digital, que se complacen en hablar del impacto de las soluciones en los usuarios finales, pero no en los individuos que se encuentran delante, como por los especialistas en ética de la inteligencia artificial, que tienden a centrarse en cuestiones exclusivamente técnicas, y por los departamentos de RSE, supuestamente sensibles a la sostenibilidad de las cadenas de suministro.

Esperamos que esta reflexión inspire a los profesionales de la IA y a todo su ecosistema a pasar a la acción. Las recomendaciones que hemos presentado son sólo los primeros pasos de un movimiento que esperamos que crezca y trascienda los límites de nuestra organización.

Si no quieres quedarte fuera del cambio, ¡únete a nosotros!

(1) Hagendorff Thilo, “Blind spots in AI ethics”, AI and Ethics 2, December 2021. Same constant in Tessier Catherine, Éthique et IA : analyse et discussion, CNIA 2021 : Conférence Nationale en Intelligence Artificielle, Juin 2021.T. Hagendorff adds that the reason these considerations polarize discussions of AI ethics is because these issues can be resolved technically: “AI ethics often frames AI applications as isolated technical artefacts or entities that can be optimized by experts who apply technical solutions to technical problems that are depicted as problems of ethical AI. Contrary to this position, this paper argues that AI applications must not be conceived in isolation but within a larger network of social and ecological dependencies and relationships.”

(2)  High-Level Expert Group on Artificial Intelligence. Policy and Investment Recommendations for Trustworthy AI. Commission européenne, 2019.

(3) Data Engineering, Preparation, and Labeling for AI 2020, Cognilytica Research, 2020.

(4) Graham Mark, Hjorth Isis, Lehdonvirta Vili, “Digital labour and development: impacts of global digital labour plaforms and the gig economy on worker livelihoods”, Transfer: European Review of Labour and Research, 2017.

(5) Kaye Kate, “These companies claim to provide “fair-trade” data work. Do they?”, MIT Technology Review, 2019.

(6) Zorthian Julia, “Exclusive: OpenAI Used Kenyan Workers on Less Than $2 Per Hour to Make ChatGPT Less Toxic”, Time, 2023

(7) Ibid.

(8) Graham Mark, Hjorth Isis, Lehdonvirta Vili, “Digital labour and development: impacts of global digital labour plaforms and the gig economy on worker livelihoods”, op. cit.

(9) Ibid.

(10) Todos los recursos producidos sobre este tema están disponibles aquí

(12) Por ejemplo, es posible acceder a estudios especializados de la IDH Recognized Living Wage Benchmarks.

background

Automatice su calidad. Acelere su crecimiento.