Investigación y desarrollo · Seminarios
El proyecto está motivado en demostrar la convergencia de Q-learning. Este es un algoritmo aplicado a Procesos de Decisión de Markov finitos en tiempo discreto, donde no se tiene suficiente información. Así, lo que busca el algoritmo es solucionar las ecuaciones de optimalidad (o ecuaciones de Bellman). Con este propósito en mente, en el proyecto discutimos cuatro cosas principalmente:
Aplicaciones a Procesos de Decisión de Markov completos, y soluciones para encontrar estrategias óptimas en juegos de mes
YouTube – Quantil Matemáticas Aplicadas
1. Presentación
Obtén información sobre Ciencia de datos, Inteligencia Artificial, Machine Learning y más.