Cómo aplicar el teorema del límite central a datos restringidos | de Ryan Burn | diciembre de 2024

¿Qué podemos decir sobre la media de los datos distribuidos en un intervalo? [a, b]?

Imaginemos que estamos midiendo el índice de aprobación de un político impopular. Supongamos que tomamos una muestra de diez encuestas y obtenemos los valores

¿Cómo podemos construir una distribución posterior de nuestra creencia en el índice de aprobación medio del político?

Supongamos que las encuestas son variables aleatorias independientes y distribuidas idénticamente, X_1,…, X_n. El teorema del límite central nos dice que la media muestral se aproximará asintóticamente a una distribución normal con varianza σ²/n

donde μ y σ² son la media y la varianza de X_i.

Figura 1: Gráficos de un histograma normalizado de medias de aprobación de muestra para nuestro político impopular junto con la aproximación de la distribución normal para n=1, n=3, n=5, n=7, n=10 y n=20. Podemos ver que para n=10, la distribución media muestral está bastante cerca de su aproximación normal. Figura por autor.

Motivados por este límite asintótico, aproximaremos la probabilidad de los datos observados. y con

Usando el objetivo previo

(más sobre esto más adelante) e integrar σ² nos da la distribución para el posterior, π(μ|y)

dónde

Veamos la distribución posterior de los datos de la Tabla 1.