Cosmología al extremo: inteligencia artificial para mapear el Universo a gran escala

© Claire Lamman/DESI collaboration; custom colormap package by cmastro

¿Qué pasaría si las leyes de la física que conocemos estuvieran mal? No en algún detalle menor, sino en algo fundamental. Esa es una de las dos posibles conclusiones que se derivan de los datos más recientes sobre el universo a gran escala: o existe una componente de energía completamente desconocida, o nuestra física necesita rehacerse desde sus cimientos. En cualquiera de los dos casos, la inteligencia artificial está en el centro de cómo estamos llegando a esa respuesta.

En el seminario del 20 de noviembre de 2025, Jaime Forero-Romero, profesor asociado del Departamento de Física de la Universidad de los Andes, presentó el estado actual de este problema: cómo mapear el universo a gran escala, qué nos dice ese mapa sobre su composición y destino, y cómo la inteligencia artificial se ha vuelto indispensable en cada paso del proceso.

Un mapa donde cada punto es una galaxia

El trabajo central de Jaime consiste en construir mapas del universo. Mapas tridimensionales reales donde cada punto representa una galaxia completa, y la Vía Láctea entera cabe en menos de un píxel. Estos mapas se construyen con telescopios espectroscópicos que miden el corrimiento al rojo de millones de galaxias, lo que permite inferir su distancia y ubicarlas en el espacio.

El instrumento clave es el Dark Energy Spectroscopic Instrument (DESI), un survey de última generación ubicado en Arizona. DESI está compuesto por tres elementos: 5.000 pequeños robots, cada uno con una fibra óptica en su punta, montados sobre un telescopio que captura la luz de las galaxias, más un espectrógrafo que descompone esa luz y registra la información. El resultado es decenas de millones de espectros, más que todo lo acumulado en la historia previa de la astronomía. Sus resultados han llegado a portadas de Le Monde y The Economist.

Observar con DESI no es sentarse al lado del telescopio a mirar por el ocular. Es pasar la noche mirando terminales con gráficas y pipelines corriendo en Python, verificando que los datos estén saliendo bien y decidiendo qué comando ejecutar a continuación. La cosmología observacional del siglo XXI es, entonces, ciencia de datos.

Redshift: cómo medimos el universo

Para construir estos mapas, el concepto clave es el corrimiento al rojo o redshift. Cuando la luz de una galaxia pasa por un espectrógrafo, se descompone en sus longitudes de onda y aparecen líneas oscuras características de elementos como el hidrógeno. Si esas líneas están desplazadas hacia longitudes de onda mayores respecto a donde deberían estar según la mecánica cuántica, decimos que la galaxia tiene un corrimiento al rojo Z, donde

 

La interpretación no es, como podría pensarse, que las galaxias se alejan de nosotros como en el efecto Doppler. La interpretación correcta es que el espacio-tiempo mismo se está expandiendo. Si se corre esa película hacia atrás, se llega a un punto de densidad casi infinita: el Big Bang. Esta fue la conclusión de la famosa gráfica de Hubble, hecha hace casi 100 años con apenas una veintena de puntos, y que sentó las bases de la cosmología moderna.

Energía oscura: ¿constante o no?

A finales del siglo XX, al medir el brillo de supernovas a distintas distancias, un grupo de astrónomos descubrió que el universo no solo se expande, sino que lo hace cada vez más rápido. Por ese hallazgo recibieron el Premio Nobel de Física en 2011. Explicar esa aceleración exige una de dos cosas: o existe una componente desconocida del universo (la energía oscura) que actúa como una presión repulsiva, o las leyes de la física están equivocadas a escalas cosmológicas.

El modelo estándar desde entonces asume que la energía oscura es una constante: la misma en todo lugar y en todo tiempo, como una línea horizontal en una gráfica de densidad versus tiempo. Lo que los datos de DESI están sugiriendo es que esa línea no es recta, es decir, que la energía oscura podría variar en el tiempo. Desde que se publicó ese resultado, han aparecido aproximadamente dos o tres papers teóricos por día proponiendo explicaciones. El artículo ya acumula cerca de 1.000 citas en un año.

Vale la pena no confundir energía oscura con materia oscura, dos conceptos distintos. La materia oscura tiene gravedad, forma grumos llamados halos, y cada galaxia vive dentro de uno de ellos. La energía oscura no forma estructuras: se distribuye homogéneamente en el espacio. Ninguna de las dos se entiende del todo: la materia oscura nunca ha sido detectada en aceleradores de partículas, y la energía oscura desafía la física fundamental. En todo caso, cualquiera de las dos vías (nueva componente o física incorrecta) representa una frontera profunda del conocimiento.

Las ondas de sonido congeladas del universo temprano

Uno de los fenómenos que se buscan en estos mapas son las Oscilaciones Acústicas de Bariones (BAO). En el universo temprano existía un plasma caliente y denso atravesado por ondas de sonido, perturbaciones en la densidad que se propagaban a velocidades enormes. Cuando el universo se expandió y se enfrió, esas ondas se «congelaron» y dejaron una huella estadística en la distribución de galaxias que observamos hoy.

Esa huella se detecta como un exceso de probabilidad de encontrar pares de galaxias separadas por una distancia específica, calculable a partir de física relativista. Esta “regla estándar” de tamaño conocido permite medir distancias cósmicas y reconstruir cómo ha evolucionado la tasa de expansión del universo. Es, precisamente, el método que usa DESI para evaluar si la energía oscura varía en el tiempo.

El problema central: inversión a gran escala

El reto fundamental de la cosmología observacional puede plantearse así: dado un universo observado (un mapa de galaxias) queremos inferir los parámetros físicos que lo generaron. Es un problema de inversión masivo y de alta dimensionalidad. Se parte de lo observado y se busca devolverse a la receta: qué distribución inicial de materia y energía, bajo qué leyes físicas, produjo lo que vemos. Y ahí es donde entra la inteligencia artificial.

El crecimiento exponencial de datos lo hace inevitable. En los años 80 el estado del arte era obtener miles de espectros. En el 2000, cientos de miles. En 2010, un millón. DESI llevará esa cifra a decenas de millones. Lo que un experimento anterior lograba en cinco años, DESI lo hace en un mes, gracias a sus 5.000 robots y al procesamiento automatizado en supercomputadoras. Manejar ese volumen sin aprendizaje automático es imposible.

Tres usos de IA en DESI

El survey DESI tiene tres familias de proyectos de inteligencia artificial aplicados a los datos, desarrollados en el grupo de Jaime Forero:

  1. Reducción de dimensionalidad para detección de outliers

Cada espectro de DESI es un arreglo de aproximadamente 5.000 puntos: una intensidad por longitud de onda. Con millones de esos espectros, el espacio de datos vive en dimensión 5.000. Usando UMAP (Uniform Manifold Approximation and Projection), se reduce esa dimensionalidad a dos o tres dimensiones, preservando la estructura de similitud entre espectros. En esa representación comprimida, galaxias similares quedan agrupadas y los outliers (espectros que no se parecen a ningún otro) aparecen como islas aisladas.

Este trabajo, iniciado por el estudiante doctoral John con 1,7 millones de espectros, fue continuado por Valeria Torres Gómez, estudiante de doble programa de física e ingeniería de sistemas, ahora con acceso a 52 millones de espectros del survey completo. El pipeline corre de forma masivamente paralela en NERSC, una de las supercomputadoras más potentes del mundo, ubicada en Berkeley, y permite analizar 50 millones de espectros de un día para el otro.

¿Para qué sirven los outliers? En su mayoría revelan fallas del instrumento: fluctuaciones en las CCD, errores en el pipeline, datos contaminados. Identificarlos permite «limpiar» el mapa y garantizar que cada punto es confiable. Aunque parezca un problema secundario, reducir la basura en el mapa, incluso en un 1%, es crítico para la inferencia estadística de parámetros cosmológicos: cada fuente de incertidumbre eliminada mejora la precisión de las conclusiones. En algunos casos, además, los outliers son genuinamente atípicos desde el punto de vista astrofísico y merecen investigación propia.

  1. Predicción de redshift a partir de imágenes

Obtener el espectro completo de una galaxia es costoso en tiempo de telescopio. Sin embargo, DESI previamente tomó imágenes fotométricas del cielo. La pregunta es: ¿se puede predecir el corrimiento al rojo de una galaxia solo a partir de su imagen, sin necesidad de tomar su espectro?

Usando redes neuronales convolucionales entrenadas con los datos etiquetados de DESI, el grupo logró hacer exactamente eso: inferir el redshift de galaxias en regiones donde solo existen imágenes. Compararon dos enfoques: ingeniería de features manual versus pasar el espectro completo a la red. La red convolucional sobre el espectro completo dio mejores resultados.

  1. Clasificación de posición en la red cósmica con grafos y Random Forest

La distribución de galaxias no es aleatoria: forma una estructura filamentaria conocida como la red cósmica, con filamentos, nodos y vacíos. Clasificar en qué parte de esa estructura vive cada galaxia es una tarea que el ojo humano no puede hacer a la escala de DESI.

El enfoque del grupo fue construir un grafo sobre las posiciones de las galaxias, usando específicamente el grafo beta skeleton, popular en reconocimiento visual por seguir la conectividad que el ojo humano percibe como filamentos y, usar las propiedades de ese grafo como features de entrada a un Random Forest. El modelo, entrenado en simulaciones cosmológicas, predice si una galaxia está en un filamento, un nodo, un vacío u otra región de la red cósmica.

Un mensaje importante: la IA no es infalible

Jaime Forero-Romero fue enfático en un punto: en cosmología, ningún resultado basado en IA se acepta sin confirmación independiente. Ya sea por inspección visual de un experto humano o por un método estadístico alternativo, todo hallazgo debe validarse antes de considerarse científicamente sólido. La IA está integrada profundamente en cada paso del pipeline de DESI: desde el procesamiento cercano al instrumento hasta la interpretación de los mapas, pero siempre como una herramienta que requiere supervisión, no como un oráculo.

Conclusión

El trabajo presentado en este seminario ilustra cómo la cosmología moderna es, al mismo tiempo, física fundamental, ingeniería de datos y aprendizaje automático. Los resultados de DESI, que sugieren que la energía oscura no es constante, no habrían sido posibles sin pipelines masivos de procesamiento, reducción de dimensionalidad, redes convolucionales y clasificadores sobre grafos. Y a su vez, los problemas que plantea la cosmología (como alta dimensionalidad, datos ruidosos, inferencia inversa a gran escala) están empujando los límites de lo que la IA puede hacer.

La pregunta de fondo sigue abierta: ¿qué es la energía oscura? ¿Varía en el tiempo? ¿O estamos ante el colapso de la física como la conocemos? La respuesta, si llega, vendrá de mapas de galaxias analizados con algoritmos que hoy apenas empezamos a dominar.

Esta entrada en el blog resume el seminario «Cosmología al extremo: inteligencia artificial para mapear el Universo a gran escala», presentado por Jaime E. Forero-Romero el 20 de noviembre de 2025 en el marco de los seminarios de Quantil Matemáticas Aplicadas. El video completo está disponible en el canal de YouTube de Quantil.

Artículos recientes

En los artículos de Blog, podrás conocer las últimas noticias, publicaciones, estudios y artículos de interés de la actualidad.

IA

Cosmología al extremo: inteligencia artificial para mapear el Universo a gran escala

¿Qué pasaría si las leyes de la física que conocemos estuvieran mal? No en algún detalle menor, sino en algo fundamental. Esa es una de las dos posibles conclusiones que se derivan de los datos más recientes sobre el universo a gran escala …

Seguridad

Adversarial Robustness: ¿Qué tan difícil es romper un modelo de lenguaje?

Los modelos de lenguaje de gran escala se han convertido en herramientas cotidianas: asisten en la redacción de textos, apoyan diagnósticos médicos, generan código y responden preguntas complejas en segundos …

Tecnología

Cuando equivocarse no importa: repensando cómo entrenamos modelos que toman decisiones

La forma estándar de evaluar modelos predictivos es dominada por una idea simple: si baja el error de predicción, el modelo es mejor. Métricas como el MSE o el accuracy se han convertido en el estándar en la mayoría de pipelines industriales …

Tecnología

Más allá del promedio: Regresión por cuantiles y políticas escalonadas

Supongamos que un gobierno implementa una nueva política de salud que busca reducir hospitalizaciones evitables. Una evaluación tradicional podría decirnos que, en promedio, las hospitalizaciones caen un 10\%…

Redes Neuronales

Redes Neuronales para Optimización en Subastas del Tesoro

¿Cuál formato de subasta, el uniforme o el discriminatorio, resulta más adecuado para reducir el costo de financiamiento del Estado?…

Gobernanza de la IA

Más allá de la automatización: Por qué necesitamos nuevas métricas para entender el futuro del trabajo con IA

En los últimos años, la conversación sobre inteligencia artificial y empleo ha estado dominada por una narrativa de sustitución: ¿Qué trabajos desaparecerán? ¿Cuántos empleos serán reemplazados por algoritmos? Esta pregunta, aunque importante, nos ha llevado a mirar el futuro del trabajo con una perspectiva reducida …