Microsoft se asocia con una província de Argentina para predecir los embarazos adolescentes y el abandono escolar

Los gobiernos locales y federales de Argentina siguen invirtiendo en un futuro de gobernanza algorítmica y basada en bases de datos. A nivel nacional, el gobierno federal ha desarrollado una base de datos de perfiles de ciudadanos basada en datos socioeconómicos para asignar beneficios sociales de manera más eficiente así como una base de datos que almacena datos biométricosde la ciudadanía para mejorar la seguridad pública e investigaciones criminales.

En junio de 2017, el gobierno local de la provincia de Salta se asoció con Microsoft para crear y desplegar dos herramientas de predicción diferentes, optimizadas para identificar los embarazos de adolescentes y el abandono escolar (Ortiz Freuler e Iglesias 2018). Entrenados a partir de conjuntos de datos personales puestos a disposición por el Ministerio de la Primera Infancia de la provincia, los dos sistemas identifican a las personas con mayor riesgo de embarazo adolescente y de deserción escolar, alertando a los organismos gubernamentales sobre la identificación de las personas con alto riesgo.

Los sistemas crean predicciones después de analizar hasta 80 variables relacionadas con la persona (con categorías de variables que incluyen lo personal, la educación, la salud, el empleo, la vivienda, la familia, etc.) (ibíd.). Se ha determinado que esas variables pueden causar una discriminación indebida (ibíd.). Además, los sistemas han sido criticados por su opacidad y su índice de error. Aunque los modelos utilizan un tipo de algoritmo de aprendizaje automático llamado “árbol de decisión ampliado de dos clases” (que es más comprensible y explicable que varias alternativas), ambos sistemas todavía operan dentro de una “caja negra”. Por falta de transparencia, el sistema hace imposible que ya sea desde la ciudadanía o desde el campo de la investigación académica se pueda rastrear la lógica del algoritmo y entender por qué algunas personas reciben la etiqueta de “alto riesgo”. Los sistemas también tienen un importante índice de error, ya que el algoritmo de identificación de embarazos adolescentes genera una tasa de falsos positivos del 15% (o, etiqueta incorrectamente el 15% del tamaño de la muestra como de alto riesgo cuando no deberían recibir esa etiqueta) y el algoritmo de identificación de abandono escolar genera una tasa de falsos positivos del 20% (ibíd.). A pesar de estas críticas, otras provincias de Argentina (Tierra del Fuego, La Rioja, Chaco y Tucumán) así como una provincia de Colombia (Guajira) están negociando con el gobierno de Salta para adoptar los sistemas.

Este caso de gobernanza algorítmica en la Argentina también suscita preocupación en cuanto a su posición dentro de una tendencia que los académicos llaman colonialismo digital o el desarrollo y despliegue en el extranjero de infraestructura tecnológica dentro de los países en desarrollo para la extracción de sus datos en crudo (Kwet 2019). Al igual que las potencias coloniales históricas construyeron ferrocarriles y vías fluviales para acceder a los recursos naturales de los pueblos indígenas, los colonos digitales construyen rutas de acceso digital para extraer los datos brutos de los nativos. Los académicos han reconocido un patrón de países de ingresos medios y bajos que se asocian con empresas extranjeras para construir infraestructura basada en datos en nombre del desarrollo (Taylor y Broeders 2015). A menudo, una consecuencia imprevista de estos proyectos de datafication (o iniciativas “que generan datos digitales que son legibles por máquina y manipulables computacionalmente, particularmente para el análisis de big data”) es la creación de dinámicas de poder asimétricas que explotan a los países en desarrollo (ibid). En este caso concreto, los dos sistemas algorítmicos surgieron de un acuerdo público-privado entre el gobierno de Salta, una administración con escasos recursos y problemas sociales importantes, y Microsoft, una de las mayores corporaciones tecnológicas del mundo (ibíd). Debido a la falta de conocimientos e infraestructura de procesamiento de datos, Salta subcontrató esta responsabilidad a Microsoft y les permitió el pleno acceso a una base de datos llena de información ciudadana sensible. Dada la opacidad del proyecto, no está claro cómo analiza, almacena y procesa Microsoft los datos de la provincia. Sobre todo, la subyacente dinámica de poder desigual entre una corporación internacional con una valoración de un billón de dólares y un gobierno provincial argentino con pocos recursos debería plantear cuestiones éticas.