Cómo construir un modelo bayesiano objetivo exclusivo de encuestas que vaya desde una encuesta estatal hasta la probabilidad de ganar el estado

Con las elecciones presidenciales acercándose, una pregunta que yo, y espero que muchos otros tengan, es si las encuestas de un candidato en un estado se traducen en su probabilidad de ganar ese estado.

En esta publicación de blog, quiero explorar la pregunta utilizando la inferencia bayesiana objetiva ([3]) y los resultados electorales de 2016 y 2020. El objetivo será construir un modelo simple basado únicamente en encuestas que tome el liderazgo en las encuestas estatales de un candidato y produzca una distribución posterior para la probabilidad de que el candidato gane el estado.

Figura 1: Un ejemplo de distribución posterior para la probabilidad de victoria prevista utilizando los datos de las encuestas FiveThirtyEight de 2016 y 2020 ([1, 2]) y una instantánea de las encuestas en Pensilvania. La figura también muestra los percentiles 5, 50 y 95 de la distribución posterior de predicción. Figura por autor.

donde la distribución posterior mide nuestra creencia en cuán predictivas son las encuestas.

Para el modelo, usaré regresión logística con una única variable de peso desconocida, w:

Tomando las elecciones de 2020 y 2016 como observaciones y utilizando un valor previo adecuado, π, podemos producir una distribución posterior para el peso desconocido.

dónde