Double-robust estimators in log-linear capture-recapture models

09/03/2023
Daniel Lasso
Artificial intelligence

¿Cómo podríamos estimar el número de desaparecidos por el conflicto armado colombiano? O ¿Cuántos individuos quedan de una población de animales en vía de extinción? Estas son preguntas que permiten responder los estimadores de captura y recaptura, en últimas, estos buscan calcular la cantidad total de la población existente con base en información recopilada a través de muestras.

La figura 1 presenta el método de captura y recaptura. En este, suponga que tiene una población total sobre la que desconoce su tamaño (N) representada por la letra d, pero, a través del muestreo identificó a dos partes de la población (fuente 1 y 2). Ahora, sea b el número de individuos en la fuente 1, c el número de individuos en la fuente 2 and a el número de individuos que aparecen en ambas fuentes. Entonces se puede estimar la cantidad total de individuos (N) como N= c*b/a. No obstante, para que esta estimación sea posible se debe partir de un supuesto importante: independencia entre listas. Este supuesto sugiere que la probabilidad de ser capturado en una lista es independiente de la probabilidad de ser capturada en otra.

Figura 1: representación gráfica del método de captura y recaptura con dos fuentes

Claro, este supuesto es plausible en poblaciones de animales, donde la probabilidad de capturar un individuo es independiente de recapturarlo. No obstante, en poblaciones sociales como las personas pueden haber patrones de comportamiento como la ubicación, las migraciones, entre otros que hagan que un individuo sea capturado en múltiples listas, violando el cumplimiento de este supuesto. Aunque, en épocas modernas se desarrollaron nuevas formas de estimación más elaboradas como los modelos log-lineales, no obstante, siguen partiendo de este “dudoso” supuesto o relajándolo a que esta probabilidad es independiente si “condiciono” por algunas características observables.

En esta línea, Mateo Dulce ofrece una solución muy inteligente. Utiliza una reciente literatura sobre estimadores robustos para encontrar una forma estadística, con mínima varianza, insesgada y consistente de estimar este parámetro, incluso si se rompe este supuesto de independencia. Para esto, intuitivamente trata de estimar el sesgo presente en la estimación inicial, usando teoría de eficiencia semiparamétrica. Dada la dificultad que tiene explicar estos de forma intuitiva, les dejo los enlaces de la página de Mateo Dulce por si quieren aprender más sobre el tema:

Mateo Dulce Rubio – Statistics & Data Science – Dietrich College of Humanities and Social Sciences – Carnegie Mellon University (cmu.edu)

También, pueden seguir el canal de youtube de Quantil, donde se publican las grabaciones de los semilleros. Entre estos el de Mateo.

Quantil Matemáticas Aplicadas – YouTube

Muchas gracias por leerme.

Cosmology to the Extreme: Artificial Intelligence for Mapping the Universe on a Large Scale

What if the laws of physics as we know them were wrong? Not in some minor detail, but in something fundamental. That is one of the two possible conclusions that emerge from the most recent data on the large-scale universe …

Read article

Safety

Adversarial Robustness: How difficult is it to break a language model?

Large language models have become everyday tools: they assist in writing texts, support medical diagnoses, generate code, and answer complex questions in seconds …

Read article

Technology

When Mistakes Don’t Matter: Rethinking How We Train Decision-Making Models

The standard way to evaluate predictive models is dominated by a simple idea: if prediction error decreases, the model is better. Metrics such as MSE or accuracy have become the standard in most industrial pipelines …

Read article

Technology

Beyond the Average: Quantile Regression and Stepwise Policies

Suppose a government implements a new health policy aimed at reducing avoidable hospitalizations. A traditional evaluation might tell us that, on average, hospitalizations fall by 10%…

Read article

Neural Networks

Neural Networks for Optimization in Treasury Auctions

Which auction format—uniform-price or discriminatory—is more suitable for reducing the government’s financing cost?…

Read article

AI Governance

Beyond Automation: Why We Need New Metrics to Understand the Future of Work with AI

In recent years, the conversation about artificial intelligence and employment has been dominated by a substitution narrative: Which jobs will disappear? How many jobs will be replaced by algorithms? While this question is important, it has led us to view the future of work from a narrow perspective…

Double-robust estimators in log-linear capture-recapture models

Tags

Newsletter

Recent articles

IA

Cosmology to the Extreme: Artificial Intelligence for Mapping the Universe on a Large Scale

Read article

Safety

Adversarial Robustness: How difficult is it to break a language model?

Read article

Technology

When Mistakes Don’t Matter: Rethinking How We Train Decision-Making Models

Read article

Technology

Beyond the Average: Quantile Regression and Stepwise Policies

Read article

Neural Networks

Neural Networks for Optimization in Treasury Auctions

Read article

AI Governance

Beyond Automation: Why We Need New Metrics to Understand the Future of Work with AI

Read article

Let's keep in touch

Our social networks

Services

Resources