Más allá de la automatización: Por qué necesitamos nuevas métricas para entender el futuro del trabajo con IA

En los últimos años, la conversación sobre inteligencia artificial y empleo ha estado dominada por una narrativa de sustitución: ¿qué trabajos desaparecerán? ¿Cuántos empleos serán reemplazados por algoritmos? Esta pregunta, aunque importante, nos ha llevado a mirar el futuro del trabajo con una perspectiva reducida. Isabella Loaiza, investigadora postdoctoral del MIT Sloan School of Management, presentó recientemente en el Centro de Analítica para Políticas Públicas (CAPP) una perspectiva distinta: en lugar de preguntarnos qué empleos desaparecerán, deberíamos preguntarnos cómo humanos y máquinas pueden complementarse mejor.
Lo que hace que esta investigación sea particularmente relevante es que no se trata solo de una diferencia filosófica. El problema es metodológico. Las métricas que actualmente dominan el debate sobre IA y empleo están, casi por diseño, sesgadas hacia la automatización.

El vacío metodológico que nadie quiere ver

La métrica más influyente en este campo es la de «exposure» o exposición, que mide qué tan vulnerable es una tarea a ser impactada por la inteligencia artificial. Suena razonable, pero tiene un problema fundamental: no distingue entre automatización (cuando la IA reemplaza al humano) y aumentación (cuando la IA complementa las capacidades humanas).

Esta limitación importa porque las métricas existentes casi no consideran que las tareas dentro de una ocupación están interconectadas. Un abogado no solo revisa contratos o presenta argumentos ante un juez de manera aislada; estas tareas se entrelazan, se complementan, se potencian mutuamente. Y es precisamente en esas interconexiones donde surge el verdadero potencial de colaboración humano-máquina.

Las cinco limitaciones de la IA que definen lo humano

Para desarrollar una métrica más completa, Loaiza y su equipo comenzaron con una pregunta fundamental: ¿cuáles son las capacidades humanas que la inteligencia artificial no puede copiar fácilmente? De sus entrevistas con más de 400 profesionales en distintos campos, identificaron cinco limitaciones críticas de la IA:

  • Inferencia con pocos datos. Los humanos somos extraordinariamente buenos aprendiendo de ejemplos escasos. Un niño puede entender qué es una silla después de ver tres ejemplos diferentes, no necesita ver cientos. ¿Por qué? Porque creamos modelos mentales, descubrimos patrones subyacentes.
  • Extrapolación creativa. La capacidad de crear algo nuevo a partir de un evento específico requiere originalidad que va más allá de recombinar patrones existentes. Escribir una novela sobre una experiencia personal, diseñar una solución arquitectónica para un terreno único: estos actos creativos implican saltos conceptuales que las IA actuales no logran replicar consistentemente.
  • Resolución guiada por valores. Cuando un problema tiene múltiples soluciones técnicamente válidas, los humanos elegimos basándonos en valores éticos y culturales. La IA carece de este marco de referencia interno. ¿Cómo priorizamos entre eficiencia económica y bienestar comunitario? Estas decisiones requieren juicios que van más allá del cálculo.
  • Resultados relacionales. Los humanos valoramos las relaciones por sí mismas, incluso cuando no podemos cuantificar su beneficio inmediato. Evolutivamente sabemos que mantenernos en grupo es beneficioso, aunque no siempre veamos exactamente cómo o por qué. El apoyo emocional sostenido, la confianza construida a lo largo del tiempo, la red de reciprocidad: estos resultados son difíciles de medir para la IA pero fundamentales para nuestro bienestar.
  • Decisiones basadas en creencias. A veces actuamos basándonos en cómo creemos que el mundo debería funcionar, no en cómo los datos históricos sugieren que funciona. El sufragio femenino no pudo justificarse con datos del pasado precisamente porque nunca había existido. Fue una decisión basada en una visión de justicia, en una apuesta por un futuro diferente.

 

De las limitaciones de la IA a las capacidades EPOCH

A partir de estas cinco limitaciones, el equipo de investigación destiló cinco grupos de capacidades humanas distintivas, creando el acrónimo EPOCH:

E – Empatía e inteligencia emocional: La compasión genuina, el sentir con el otro. Los modelos de lenguaje pueden generar respuestas que parecen empáticas, pero carecen de un verdadero entendimiento basado en la experiencia compartida de ser humano.

P – Presencia: La cualidad de existir en el mismo espacio físico. El COVID nos mostró de manera dramática qué aspectos del trabajo y la vida son verdaderamente irremplazables en términos de presencialidad.

O – Opinión y juicio ético: Pensamiento crítico, razonamiento causal e intuición. La capacidad de cuestionar supuestos, de ver conexiones no obvias, de hacer juicios matizados en contextos complejos.

C – Creatividad, curiosidad e imaginación: Los LLMs pueden crear contenido que supera al humano promedio, es cierto. Pero no superan  a los mejores humanos en sus respectivos campos creativos.

H – Esperanza, visión y liderazgo: La capacidad de hacer algo a pesar de que las probabilidades de éxito sean mínimas. De imaginar un futuro radicalmente diferente y movilizar a otros hacia él.

 

Una metodología innovadora: redes de tareas complementarias

Con las capacidades EPOCH definidas, el equipo enfrentó un desafío metodológico: ¿cómo medir estas capacidades en las miles de tareas que componen el mercado laboral? Utilizaron la base de datos O*NET, que cataloga 19,000 tareas distribuidas en 900 ocupaciones del mercado laboral estadounidense.

Aquí viene la parte innovadora: emplearon un modelo de embeddings (derivado de BERT) para medir la similitud semántica entre cada tarea y las cinco capacidades EPOCH. Esto les permitió clasificar cada tarea según su alineación con estas capacidades humanas distintivas. Sí, usar un modelo de lenguaje como BERT introduce cierta opacidad metodológica, pero también permite un análisis a una escala que sería imposible manualmente.

Pero el verdadero salto conceptual vino después. En lugar de analizar tareas de manera aislada, crearon redes de tareas para capturar su complementariedad dentro de cada ocupación. La lógica es elegante: si dos tareas están interconectadas en una profesión, y una tiene un EPOCH score alto (muy humana) mientras la otra tiene un EPOCH score bajo (fácilmente automatizable), entonces existe un potencial alto de aumentación. En ese escenario, humanos y máquinas pueden distribuirse el trabajo o colaborar para resolver ambas tareas de manera más efectiva.

En contraste, si ambas tareas tienen EPOCH alto, probablemente sean resistentes a la automatización. Y si ambas tienen EPOCH bajo, es probable que ambas puedan automatizarse completamente.

Hallazgos que desafían la narrativa dominante

Los resultados de aplicar esta metodología revelaron patrones interesantes que la métrica tradicional de «exposure» no captura.

Las ocupaciones con los EPOCH scores más altos resultaron ser management y enfermería. Estas profesiones tienen poco riesgo de automatización, pero también, sorpresivamente, poco potencial de aumentación tal como la medimos actualmente. ¿Por qué? Porque la aumentación que medimos se basa en la complementariedad entre tareas de alto y bajo EPOCH. Cuando casi todas tus tareas requieren capacidades profundamente humanas, hay menos espacio para delegar componentes a la IA.

Pero aquí surge un limitante importante: esta medición de aumentación captura solo la colaboración basada en distribución de tareas existentes. No captura lo que podríamos llamar «aumentación expansiva»: la capacidad de hacer cosas que antes eran imposibles. Antes del microscopio, ver microorganismos era imposible, no solo difícil.  Esta dimensión de la aumentación aún no sabemos cómo medirla adecuadamente.

El caso más fascinante fueron las profesiones legales. Estas mostraron distribuciones EPOCH bimodales: un grupo de tareas con EPOCH muy bajo (trabajo burocrático, revisión de documentos estándar, búsqueda de precedentes) y otro grupo con EPOCH muy alto (argumentación ante jueces, negociación compleja, asesoramiento estratégico que requiere juicio ético). Esta estructura bipartita señala un potencial enorme de aumentación: la IA puede encargarse del trabajo de bajo EPOCH, liberando a los profesionales para enfocarse en las dimensiones que requieren capacidades genuinamente humanas.

Un giro inesperado: el trabajo se está volviendo más humano

Quizás el hallazgo más esperanzador emerge de comparar los datos entre 2016 y 2024. Contrario a los temores de que la automatización está deshumanizando el trabajo, los investigadores encontraron un movimiento medible hacia tareas más humanas, más intensivas en EPOCH.

Las tareas nuevas que aparecieron en el dataset entre 2016 y 2024 tienen, en promedio, scores EPOCH más altos que las que fueron eliminadas. Las tareas con alto EPOCH aumentaron en frecuencia. Y cuando analizaron el crecimiento del empleo, encontraron una correlación positiva con el score EPOCH: las ocupaciones ricas en capacidades humanas distintivas están creciendo.

El score de aumentación también mostró correlación positiva con el crecimiento del empleo, aunque menor que EPOCH. Y el score de automatización mostró el patrón opuesto: correlación negativa con el crecimiento del empleo.

Reescribiendo la narrativa

Lo que esta investigación nos muestra es que las preguntas equivocadas que hemos estado haciendo están sesgadas. En lugar de obsesionarnos con qué trabajos desaparecerán, deberíamos preguntarnos cómo podemos diseñar mejores sinergias entre humanos y máquinas. En lugar de asumir que la IA nos reemplazará, deberíamos identificar dónde puede liberarnos para hacer lo que hacemos mejor: empatizar, crear, juzgar con valores, construir relaciones, imaginar futuros alternativos.

Las métricas importan porque dan forma a nuestras políticas, a nuestras inversiones en educación, a nuestras decisiones sobre qué habilidades cultivar. Si nuestras métricas solo capturan el riesgo de automatización, nuestras políticas se enfocarán en la defensa y la resistencia. Pero si nuestras métricas capturan también el potencial de aumentación, nuestras políticas pueden enfocarse en el diseño deliberado de mejores colaboraciones humano-máquina.

Esta investigación no niega que la IA transformará profundamente el mundo del trabajo. Pero nos ofrece una visión más completa para entender esa transformación. Y nos recuerda que el futuro del trabajo no está predeterminado por la tecnología, sino que será moldeado por las preguntas que hagamos, las métricas que construyamos, y las complementariedades que decidamos diseñar.

Bibliografía

Loaiza, Isabella and Rigobon, Roberto, The EPOCH of AI: Human-Machine Complementarities at Work (November 21, 2024). MIT Sloan Research Paper No. 7236-24, Available at SSRN:https://ssrn.com/abstract=5028371 or http://dx.doi.org/10.2139/ssrn.5028371

Artículos recientes

En los artículos de Blog, podrás conocer las últimas noticias, publicaciones, estudios y artículos de interés de la actualidad.

Gobernanza de la IA

Más allá de la automatización: Por qué necesitamos nuevas métricas para entender el futuro del trabajo con IA

En los últimos años, la conversación sobre inteligencia artificial y empleo ha estado dominada por una narrativa de sustitución: ¿Qué trabajos desaparecerán? ¿Cuántos empleos serán reemplazados por algoritmos? Esta pregunta, aunque importante, nos ha llevado a mirar el futuro del trabajo con una perspectiva reducida …

IA

IA para el Bien Común: Capacidades, Poder y Participación

¿Cómo debemos entender el concepto de desarrollar Inteligencia Artificial para el bien común? Esta es una pregunta clave, que según la filósofa Diana Acosta Navas, abre dos dimensiones centrales: una filosófica y otra política …

IA

SESGO: Una mirada crítica a los sesgos de la IA en español

En los últimos años, los modelos de lenguaje han transformado la manera en la que interactuamos con la información. Desde asistentes virtuales hasta sistemas de apoyo en la toma de decisiones, estas herramientas se han vuelto omnipresentes …

Justicia Algorítmica

Justicia en los Modelos de Inteligencia Artificial: Nueva Perspectiva Basada en el Re-diseño de Algoritmos

En los últimos años, los modelos de inteligencia artificial han demostrado un potencial increíble para transformar industrias, desde la salud hasta las finanzas. Sin embargo, también han expuesto un problema preocupante: el sesgo algorítmico.

Machine Learning

Inferencia Robusta y Cuantificación de Incertidumbre para la Toma de Decisiones Basada en Datos

Los modelos de aprendizaje automático se han convertido en herramientas esenciales para la toma de decisiones en sectores críticos como la salud, las políticas públicas y las finanzas. Sin embargo, su aplicación práctica enfrenta dos grandes desafíos: el sesgo de selección en los datos y la cuantificación adecuada de la incertidumbre.

Redes Neuronales

El Potencial Impacto del Aprendizaje de Máquinas en el Diseño de las Políticas Públicas en Colombia: Una década de experiencias

Este blog es un resumen extendido del articulo Riascos, A. (2025).1 Desde el inicio de la llamada tercera ola de redes neuronales (Goodfellow et al., (2016)), en la primera década de este siglo, se ha generado una gran esperanza en las posibilidades de la inteligencia artificial para transformar todas las actividades humanas. Asimismo, se han levantado alertas sobre los riesgos que conlleva la introducción de esta nueva tecnología (Bengio et al., (2024)).