“Cuando la Corte dictó la sentencia, se citó el análisis y mencionaron mi nombre. Al escucharlo, los abogados voltearon, porque casi nunca nombran a nadie. Dijeron que, gracias a ese análisis, a esa colaboración, se habían convencido de que tenían que eliminar el 95% de las sentencias”.
Así recuerda Paola Villarreal, la científica de datos mexicana, el momento en el que la Corte Suprema de Massachusetts, en 2017, decidió dar vuelta atrás a más de 22,000 condenas de personas afroamericanas y latinas por delitos relacionados con drogas, en una charla con TecScience unas horas antes de presentar su libro Inteligencia artificial: el nuevo cerebro electrónico en la edición 2025 de la Feria Internacional del Libro Monterrey.
A través del proyecto Data for Justice—con datos públicos del sistema judicial del estado de Massachusetts— la programadora autodidacta demostró que las sentencias estaban basadas en pruebas manipuladas y casos de discriminación racial. Consiguió ese impacto social a través de la ciencia de datos, que es la disciplina que permite convertir grandes volúmenes de información en conocimiento para entender o resolver problemas.
La herramienta Augmented Narrative Toolkit (ANT) —que desarrolló para ese proyecto—y su análisis le valieron a Villarreal ser reconocida por el Instituto Tecnológico de Massachusetts (MIT), que la incluyó en 2018 en su listado Innovators Under 35 LATAM, publicado por la revista MIT Technology Review, y la premió dentro de la categoría de Visionario. Además, la BBC la nombró en su listado de Las 100 mujeres más influyentes del mundo en 2019.
Ciencia de datos para traer justicia social
En su libro presenta a la inteligencia artificial (IA) como una de las herramientas de la ciencia de datos, desde sus orígenes, sus aplicaciones actuales, los desafíos que representa en temas de privacidad y ética de datos, hasta sus potenciales usos en la sociedad del mañana.
Para Villarreal, lo más importante ha sido el impacto social y de justicia que ha generado a través de la ciencia de datos. Platica que, con los años, más y más personas fueron recuperando su libertad. Pero Data for Justice no ha sido el único caso con el que ha visto el potencial de analizar y presentar la información de una manera sencilla de entender para generar un impacto social.
En México, en 2019, como coordinadora de Proyectos de Ciencia de Datos del Consejo Nacional de Ciencia y Tecnología (hoy Conahcyt), diseñó una herramienta llamada Ecosistema Nacional Informático en Pro de la Búsqueda de Personas Desaparecidas (ENIPD) que sirvió para que investigadores pudieran recopilar, generar y analizar mejor los datos.
“Los temas sociales, de derechos humanos y de justicia son donde la ciencia de datos tiene más potencial y donde más hace falta. Nos ayuda a tratar de explicar fenómenos que, por su complejidad, serían imposibles de analizar sin las herramientas que ofrece”, dice, “en crisis como la de las personas desaparecidas, puede ser fundamental para reducir los efectos negativos, buscar justicia para las víctimas y la sociedad, y prevenir que siga ocurriendo. Utilizar la ciencia de datos para acceder a nuestros derechos es el mejor uso que se le puede dar, no solo a los datos, sino a la tecnología en general”.
Para desarrollar un proyecto con alto potencial de impacto social, explica, primero debe haber colaboración multidisciplinaria, con la participación no solo de científicos de datos, sino de activistas, abogados, periodistas, investigadores y expertos de organizaciones sociales. Eso permitirá comprender el contexto del problema, definir objetivos y hacer una planeación para que el proyecto se pueda sostener a largo plazo.
También es necesario tener un propósito social fuerte con una meta clara, en Data for Justice —y gracias a una beca de Mozilla Foundation— colaboró con la Unión Estadounidense por las Libertades Civiles (ACLU, por sus siglas en inglés), una organización con una trayectoria de más de un siglo dedicada a defender los derechos civiles de las personas, ante la discriminación y políticas injustas.
“Mi meta estaba clara: conseguir justicia para esas miles de personas. Eso me daba el impulso para lograr lo que los abogados del Estado no querían que consiguiera, que era analizar las bases de datos —de sentencias, cargos, arrestos y nombres— para poder conectar, ya no números o claves, sino personas”.
Calidad en los datos para un impacto social
Villarreal menciona en su libro Inteligencia artificial: el nuevo cerebro electrónico que los datos son tan fundamentales para la IA como los átomos para la materia, en ese sentido, es vital tener información de calidad para entrenar a los modelos y algoritmos.
En un proyecto de ciencia de datos es igual de importante, pero hay grandes desafíos cuando se trata de obtener información relevante. Por ejemplo, muchas veces los datos no están disponibles de forma directa y es necesario hacer solicitudes públicas.
Entre los datos más sensibles para la programadora están los de localización; con ellos se puede hacer un rastreo de las personas a través del tiempo para encontrar patrones sobre sus hábitos, algo que fue útil durante la pandemia de Covid-19 para estudiar si había comunicación o actividad económica entre los municipios y a partir de ahí tomar decisiones de política pública.
Además, indicadores de pobreza, nivel educativo, acceso a servicios de salud y otras estadísticas que se pueden combinar para entender un contexto social.
Otro de los grandes retos —si no es que el más importante— según Villarreal es la normalización de los datos. Consiste en limpiar la información para que las bases de datos se puedan conectar y entenderse con otras para generar matches y muestras con mayor representatividad.
Como cuando en fuentes distintas hay nombres escritos de varias maneras, con o sin acentos, con ‘s’ o con ‘z’, e identificadores diferentes para los mismos propósitos como códigos postales y AGEBs (subdivisiones geográficas agrupadas por manzanas). También hay que traducir los resultados de los análisis de manera comprensible para quienes toman las decisiones, ya sean jueces, legisladores o medios de comunicación.
Aplicar los datos para la toma de decisiones
Sin embargo, en algunos casos, pese a que la información se presenta en forma y hay modelos de simulación en universidades o centros de investigación, “no están comunicados o conectados con los tomadores de decisiones. Ese es otro problema: necesitamos que los datos y el conocimiento que se generen estén conectados a la política pública y tengan influencia en la vida de las personas”.
En Boston, Villarreal logró identificar sesgos raciales en la impartición de justicia y considera que un proyecto similar podría servir para encontrar ciertas tendencias en regiones como la nuestra.
“En Latinoamérica, la clase social está relacionada con el color de piel y con la pobreza. Los pobres son los que tienen menor acceso a la justicia, a la educación, a la vivienda, a la ciudad, al transporte; también en el medio ambiente hay discriminación, con las personas desplazadas que viven en lugares donde el cambio climático las pone en riesgo; incluso, en el urbanismo, por la forma que tienen nuestras ciudades hay muchos sesgos históricos”.
Además, los proyectos de impacto social de hoy se pueden apoyar en diferentes herramientas tecnológicas que han avanzado al paso de los años, por ejemplo, Villarreal no utilizó en Data for Justice IA como la que conocemos. Sus capacidades actuales sirven para analizar miles y miles de páginas de manera automatizada, encontrar nombres, instituciones y otras clasificaciones, o para desarrollar modelos que pueden entender y explicar de manera más sencilla las grandes bases de datos.
“La IA permite nuevas formas de hacer ciencia e investigación. Con ella vamos a encontrar nuevos problemas, retos y cosas positivas. Tengo mucha esperanza en que vamos a seguir haciendo ciencia real con su ayuda y espero que sea cada vez de mayor calidad, más abundante y de forma más significativa para entender mejor todos los ámbitos de la vida humana, pero también de la naturaleza, la astronomía y todo lo que necesitamos entender”.
¿Te interesó esta historia? ¿Quieres publicarla? Contacta a nuestra editora de contenidos para conocer más marianaleonm@tec.mx