Equidad en modelos de inteligencia artificial: ¿Cómo mitigar la discriminación en presencia de múltiples atributos sensibles?

29/08/2024
* Xamy López
Gobierno, Inteligencia artificial, Tecnología

Supongamos que contamos con un modelo de aprendizaje de máquinas, f, que predice el precio de una prima de seguros, Y, para unos datos que incluyen un atributo sensible, como lo es el género. Puede existir una discriminación debido a un sesgo estadístico (injusticias del pasado o desbalance en la muestra), una correlación entre el atributo sensible y alguna variable explicativa, o por un sesgo intencional que se tenga.

Para evitar este sesgo, ha habido legislaciones (como por ejemplo, AI ACT – Europe, 2024) que limitan, o incluso eliminan, el uso de ciertos atributos sensibles en modelos de inteligencia artificial. Sin embargo, simplemente eliminar estos atributos no es siempre la solución que genera el mejor nivel de justicia ni el mejor rendimiento del modelo. Existen enfoques de preprocesamiento (encargados de modificar los datos de entrada), procesamiento (añaden una penalidad de equidad) y de postprocesamiento (modifican la distribución univariada de las predicciones para crear una distribución intermedia, tal como se hace en Sequential Fairness)

Ha habido varios acercamientos de postprocesamiento para mitigar estos efectos si se tiene un atributo sensible (Single sensitive atribute, SSA). Pero, ¿qué podemos hacer si se cuenta con múltiples atributos sensibles (Multiple sensitive atribute, MSA)? Una posible aproximación es considerar la intersección de las distribuciones creadas por cada una de las combinaciones entre los atributos sensibles. Por ejemplo, si se tiene como atributos sensibles género (femenino y masculino), y origen étnico (negro y blanco), se considerarían estos cuatro casos con el enfoque de SSA:

Esto puede ser costoso computacionalmente entre más atributos sensibles se tengan, además, al añadir un nuevo atributo sensible se pierde el trabajo previamente hecho, porque se deben hallar distribuciones con las nuevas combinaciones. Otra aproximación (que es la que nos atañe en este blog) es la de Sequential Fairness. En resumen, este enfoque busca modificar las predicciones del modelo para que sean justas para el primer atributo sensible y, luego, volver a modificar estas nuevas predicciones para que sean justas para el segundo atributo (y en consecuencia también para el primero), y así sucesivamente. Como beneficios a este acercamiento tenemos que este es un proceso conmutativo (no importa el orden de la secuencia de los atributos para hacer al modelo justo), también es fácil añadir nuevos atributos sensibles y, además, hace más sencilla su interpretabilidad.

La idea es hallar una distribución representativa que se encuentre entre las distribuciones condicionales para las predicciones de los atributos sensibles. Esto se logra usando el baricentro de Wasserstein, intentando minimizar el costo total de mover una distribución a otra mediante el transporte óptimo. El concepto del baricentro de Wasserstein extiende la idea de la paridad demográfica fuerte (Strong Demographic Parity) a múltiples atributos, la cual busca reducir la inequidad en grupos y requiere que las predicciones de un modelo sean independientes de los atributos sensibles.

Es importante tener en cuenta que los métodos para reducir la injusticia de los modelos de predicción siempre tienen un costo en el rendimiento. Sin embargo, este acercamiento, al usar el baricentro de Wasserstein, hace que las métricas de accuracy y MSE tengan el menor daño posible.

Equipy es un paquete de Python que implementa Sequential Fairness en las predicciones de modelos de predicción continua de aprendizaje de máquinas que contengan múltiples atributos sensibles, que usa el concepto del baricentro de Wasserstein para no afectar de gran manera el rendimiento del modelo y mitigar el sesgo y la discriminación que puede haber en las predicciones por tener atributos sensibles.

* Este blog está basado en la presentación hecha durante el seminario de Quantil del día 8 de agosto de 2024 por Agathe Fernandes Machado titulado EquiPy: A Python package for Sequential Fairness using Optimal Transport with Applications in Insurance, en la que cuenta un poco sobre la investigación realizada por ella y su equipo en la *Université du Québec à Montréal (**UQAM) para implementar un paquete de Python que implementa sequential fairness* para mitigar injusticias en presencia de múltiples atributos sensibles.

Artículos recientes

En los artículos de Blog, podrás conocer las últimas noticias, publicaciones, estudios y artículos de interés de la actualidad.

Tecnología

Más allá del promedio: Regresión por cuantiles y políticas escalonadas

Supongamos que un gobierno implementa una nueva política de salud que busca reducir hospitalizaciones evitables. Una evaluación tradicional podría decirnos que, en promedio, las hospitalizaciones caen un 10\%…

Leer artículo

Redes Neuronales

Redes Neuronales para Optimización en Subastas del Tesoro

¿Cuál formato de subasta, el uniforme o el discriminatorio, resulta más adecuado para reducir el costo de financiamiento del Estado?…

Leer artículo

Gobernanza de la IA

Más allá de la automatización: Por qué necesitamos nuevas métricas para entender el futuro del trabajo con IA

En los últimos años, la conversación sobre inteligencia artificial y empleo ha estado dominada por una narrativa de sustitución: ¿Qué trabajos desaparecerán? ¿Cuántos empleos serán reemplazados por algoritmos? Esta pregunta, aunque importante, nos ha llevado a mirar el futuro del trabajo con una perspectiva reducida …

Leer artículo

IA

IA para el Bien Común: Capacidades, Poder y Participación

¿Cómo debemos entender el concepto de desarrollar Inteligencia Artificial para el bien común? Esta es una pregunta clave, que según la filósofa Diana Acosta Navas, abre dos dimensiones centrales: una filosófica y otra política …

Leer artículo

IA

SESGO: Una mirada crítica a los sesgos de la IA en español

En los últimos años, los modelos de lenguaje han transformado la manera en la que interactuamos con la información. Desde asistentes virtuales hasta sistemas de apoyo en la toma de decisiones, estas herramientas se han vuelto omnipresentes …

Leer artículo

Justicia Algorítmica

Justicia en los Modelos de Inteligencia Artificial: Nueva Perspectiva Basada en el Re-diseño de Algoritmos

En los últimos años, los modelos de inteligencia artificial han demostrado un potencial increíble para transformar industrias, desde la salud hasta las finanzas. Sin embargo, también han expuesto un problema preocupante: el sesgo algorítmico.

Equidad en modelos de inteligencia artificial: ¿Cómo mitigar la discriminación en presencia de múltiples atributos sensibles?

Tags

Newsletter

Artículos recientes

Tecnología

Más allá del promedio: Regresión por cuantiles y políticas escalonadas

Leer artículo

Redes Neuronales

Redes Neuronales para Optimización en Subastas del Tesoro

Leer artículo

Gobernanza de la IA

Más allá de la automatización: Por qué necesitamos nuevas métricas para entender el futuro del trabajo con IA

Leer artículo

IA

IA para el Bien Común: Capacidades, Poder y Participación

Leer artículo

IA

SESGO: Una mirada crítica a los sesgos de la IA en español

Leer artículo

Justicia Algorítmica

Justicia en los Modelos de Inteligencia Artificial: Nueva Perspectiva Basada en el Re-diseño de Algoritmos

Leer artículo

Mantengámonos en contacto

Nuestras redes

Servicios

Recursos