Research and development - Seminars
En este estudio, liderado por José, se presenta un enfoque innovador para la generación de audios de llamadas de ranas en Colombia mediante modelos de difusión, una técnica emergente en la inteligencia generativa. Estos modelos son clave en contextos donde los datos son escasos, como en la bioacústica de especies específicas y difíciles de registrar en campo. Con el propósito de facilitar el monitoreo y conservación de la biodiversidad, el equipo aplicó modelos generativos de difusión para crear muestras de audio sintético de ranas. La metodología de difusión emplea un proceso “forward” que añade ruido de manera incremental y controlada a los datos originales, transformándolos en una representación de ruido puro, seguido de un proceso “reverse” en el que el ruido se revierte paso a paso para regenerar datos plausibles. A partir de un dataset inicial de 2.5 horas de grabaciones anotadas, se realizaron procedimientos de procesamiento y normalización para obtener audios con características acústicas específicas que los expertos pueden evaluar mediante espectrogramas. Se entrenaron redes neuronales que mejoraron la calidad de los audios generados y, finalmente, para evaluar objetivamente estos audios sintéticos, se usó una red neuronal entrenada que aplicaba una métrica de Inception Distance (FID), complementada con evaluaciones de humanos. Estos experimentos mostraron que los participantes tenían dificultades para distinguir entre los audios reales y generados, validando la precisión del modelo de difusión y sugiriendo su potencial para generar datos sintéticos en distintos contextos ambientales y expandir el monitoreo acústico de especies de difícil acceso.
YouTube – Quantil Matemáticas Aplicadas
Not available
Get information about Data Science, Artificial Intelligence, Machine Learning and more.