Desde que Isaac Newton pusiera de relieve la utilidad del lenguaje matemático más allá de la geometría, y en paralelo a los siempre sorprendentes avances científicos y tecnológicos, se ha generado un halo de prestigio alrededor de este particular lenguaje.
Un lenguaje que, como tal, es parcial: no permite una comunicación amplia como si lo permiten el alemán, el francés, el árabe o el quechua. Aún así, la fascinación generada a consecuencia de su idoneidad para describir y anticipar distintos fenómenos de nuestra realidad es cada vez mayor.
Al unir estas fantásticas capacidades con la disciplina paradigmática del consumismo, el marketing y el idioma de lustrar conceptos; sucede lo propio y, sorpresa, tenemos la nueva doctrina mágica de nuestro sistema económico: los datos.
Big Data, Data Analytics, Smart Data, o el algo más castizo “basado en datos”. Día tras día llevamos tiempo escichando la misma canción. Una canción que, una vez la intentamos representar nosotros, nos sorprende con sus virtudes. Además, seguramente conozcamos a algún “experto en datos” o, en un caso rozando lo fatídico, los seamos nosotros mismos.
Este artículo no pretende negar la mayor: un buen análisis de la información disponible es imprescindible para tomar buenas decisiones. Los datos correctamente tratados son una herramienta muy adecuada y precisa para tal tarea. Aún así, es necesario conocer sus límites y, ante todo, los sesgos de todos aquellos entusiastas lanzados a “analizar datos” con un descontrol muy propio de la pubertad.
Cathy O’Neil era una de esas. Ella misma se autodenominaba científica de datos. Una persona con una carrera académica y profesional brillante a base de usar las matemáticas para identificar patrones. Hasta que un día, como San Pablo, cayó del caballo y vio la luz. Esos datos mágicos, responden a fenómenos en el mundo real, fenómenos muchas veces vinculados a individuos. A personas. A tí, querido lector, y a mí.
La sobreexcitación en el uso del dato empieza a emponzoñarse, a dejar ver los problemas existentes. Cuando se elaboran modelos automatizados, los datos empiezan a tomar decisiones que nos afectan directamente. Los modelos automatizados generan resultados que, a su vez, retroalimentan al modelo, reafirmando cualquier sesgo sufrido por los primeros resultados. Y empezamos a sufrir sus consecuencias en nuestro día a día: en nuestra economía, en nuestra educación, en nuestro trabajo e incluso en nuestro estatus jurídico y político.
A partir de una serie de casos mediáticos y bien documentados (a mi parecer, un factor común en el ensayo estadounidense) la autora empieza a hilar una serie de injusticias resultantes del uso incontrolado de estos modelos. O’Neil elabora un claro paralelismo al nombrar estos modelos Weapons of Math Destruction, cuyo acrónimo WMD se popularizó durante el mandato de George Bush Jr. debido a la acusación sobre Iraq de la tenencia ilícita de Weapons of Mass Destruction.
Según la autora, hay tres elementos clave que se deben dar para poder considerar un modelo como una Arma de Destrucción Matemática. Primero, la magnitud; ¿cuánta gente se verá afectado por ello? Segundo, la retroalimentación del modelo; ¿recibe éste información sobre qué errores comete o únicamente bebe de sus propios datos sesgados? Finalmente, la opacidad; ¿es posible entender cómo funciona el modelo para ofrecer sus resultados?
El libro va más allá del mero aviso sobre el exceso de celo en el uso de modelos computerizados: aboga por un uso más responsable. Para O’Neil la solución pasa por enseñar, junto a la programación y la estadística, ética. Si los estudiantes aprenden sobre las consecuencias de su trabajo, serán más cuidadosos en su desempeño. Su propuesta: Juramento hipocrático para la nueva economía digital.
Me parece un comienzo encomiable y un buen cierre para el libro, tal como lo ha desarrollado la autora. Por mi parte eché de menos el abordar con mayor profundidad una hipótesis: la relación entre humanidades y ciencia. Es probable que la autora no aborde con profundidad este punto ya que no llega a tratar la CIENCIA, solamente los modelos matemáticos.
Aun así, apunta al desconocimiento de muchos “científicos de datos” sobre como la inescapable telaraña de la sociedad contemporánea esta constituida por elementos y sesgos culturales.
O’Neil reconoce modelos sesgados. Hasta cierto punto, incluso lo defiende como parte del proceso de evolución del modelo hacia una herramienta mejor. Otra cosa muy distinta son los sesgos de sus creadores. Estos pueden entrar el modelo y definir una realidad prejuzgada, impidiendo así el correcto análisis de los fenómenos.
Al final de la lectura (tanto del libro como de mi crítica) es necesario recordar la importancia de este fenómeno. Mi voluntad no es negar el uso de estos modelos, ni impedir abrazar la senda del análisis. Al igual que la autora del libro, considero demasiado grandes las potenciales pérdidas si se renuncia a este tipo de herramientas.
Sin embargo, debemos ser cautos. Aprender y preguntar dos veces cuando estamos frente a éstos modelos. Lo que nos anula como ciudadanos es el desconocimiento y la falta de voluntad de explicarnos estos modelos. Nuestro deber es buscar respuestas, bien aprendiendo las herramientas o bien exigiendo explicaciones no guiadas por un Deus Ex Machina. La curiosidad es nuestro camino al empoderamiento.