14boapjytkajampgm2bxgjw.png

¿Qué son y qué no son?

En este artículo, intento aclarar el uso de herramientas esenciales en el conjunto de herramientas del econometrista aplicado: diseños de estudios de diferencias en diferencias (DiD) y de eventos. Inspirado principalmente por mis estudiantes, este artículo desglosa los conceptos básicos y aborda conceptos erróneos comunes que a menudo confunden a los profesionales.

Si te preguntas por qué el título se centra en los Estudios de Eventos mientras también hablo de DiD, es porque, cuando se trata de inferencia causal, los Estudios de Eventos son una generalización de las Diferencias en Diferencias.

Pero antes de sumergirme en el tema, permítanme asegurarles que, si están confundidos, puede que haya buenas razones para ello. La literatura sobre DiD ha estado en auge con nuevas metodologías en los últimos años, lo que dificulta mantenerse al día. Los orígenes de los diseños de estudios de eventos tampoco ayudan…

Los comienzos de las finanzas

Los estudios de eventos se originaron en las finanzas y se desarrollaron para evaluar el impacto de eventos específicos, como anuncios de ganancias o fusiones, en los precios de las acciones. El estudio de eventos fue iniciado por Ball y Brown (1968) y sentó las bases para la metodología.

Metodología

En finanzas, la metodología de estudio de eventos implica identificar una ventana de eventos para medir «retornos anormales», es decir, la diferencia entre los retornos reales y los esperados.

Solicitud de financiación

En el contexto de las finanzas, la metodología normalmente implica los siguientes pasos:

  1. Identificar un evento de interés específico, como el anuncio de ganancias de una empresa o una fusión.
  2. Determinar una “ventana de evento” o el período de tiempo que rodea al evento durante el cual el precio de las acciones podría verse afectado.
  3. Calcular el “rendimiento anormal” de las acciones comparando su rendimiento real durante la ventana del evento con el rendimiento de un índice de referencia, como un índice de mercado o el promedio de la industria.
  4. Evaluar la significancia estadística del rendimiento anormal para determinar si el evento tuvo un impacto en el precio de las acciones.

Este enfoque metodológico ha evolucionado desde entonces y se ha expandido a otros campos, especialmente a la economía, donde se ha adaptado para adecuarse a una gama más amplia de preguntas y contextos de investigación.

Adaptación en la economía

Los economistas utilizan estudios de eventos para evaluar causalmente el impacto de los shocks económicos y otros cambios políticos significativos.

Antes de explicar cómo se utilizan los estudios de eventos para la inferencia causal, debemos abordar el tema de las diferencias en diferencias.

Enfoque de diferencias en diferencias (DiD)

El enfoque DiD generalmente implica i) una adopción de política o un shock económico, ii) dos períodos de tiempo, iii) dos grupos y iv) un supuesto de tendencias paralelas.

Permítanme aclarar cada uno de ellos a continuación:

  • i) Una adopción de políticas puede ser: el uso de IA en el aula en algunas escuelas; la expansión de jardines de infantes públicos en algunos municipios; la disponibilidad de Internet en algunas áreas; transferencias de efectivo a los hogares, etc.
  • ii) Denotamos “pretratamiento” o “pre-período” como el período anterior a la implementación de la política y «postoperatorio» como el período posterior a la implementación de la política.
  • iii) Llamamos como “grupo de tratamiento” las unidades que se ven afectadas por la política, y «grupo de control» unidades que no lo son. Tanto los grupos de tratamiento como los de control están compuestos por varias unidades de individuos, empresas, escuelas o municipios, etc.
  • iv) El supuesto de tendencias paralelas es fundamental para el enfoque DiD. Supone que, en ausencia de tratamiento, los grupos de tratamiento y control siguen tendencias similares a lo largo del tiempo.

Un error común sobre el enfoque DiD es que necesitamos una asignación aleatoria.

En la práctica, no lo hacemos. Aunque la asignación aleatoria es ideal, el supuesto de tendencias paralelas es suficiente para estimar causalmente el efecto del tratamiento sobre el resultado de interés.

Sin embargo, la aleatorización garantiza que las diferencias entre los grupos antes de la intervención sean cero y no estadísticamente significativas (aunque por casualidad puedan ser diferentes).

Fondo

Imaginemos un escenario en el que la IA esté disponible en el año 2023 y algunas escuelas adopten inmediatamente la IA como herramienta en sus procesos de enseñanza y aprendizaje, mientras que otras no lo hagan. El objetivo es comprender el impacto de la adopción de la IA en las puntuaciones de inteligencia emocional (IE) de los estudiantes.

Datos

  • Grupo de tratamiento: Escuelas que adoptaron IA en 2023.
  • Grupo de control: Escuelas que no adoptaron IA en 2023.
  • Pretratamiento: Año académico anterior al 2023.
  • Postoperatorio: Año académico 2023-2024.

Metodología

  1. Comparación previa al tratamiento: Medir las puntuaciones de los estudiantes tanto de las escuelas de tratamiento como de las de control antes de la adopción de la IA.
  2. Comparación posterior al tratamiento: Medir las puntuaciones de los estudiantes tanto de las escuelas de tratamiento como de control después de la adopción de IA.
  3. Calcular diferencias:
  • Diferencia en los puntajes de las pruebas para las escuelas de tratamiento entre antes y después del tratamiento.
  • Diferencia en los puntajes de las pruebas para las escuelas de control entre el pretratamiento y el postratamiento.

La estimación de DiD es la diferencia entre las dos diferencias calculadas anteriormente. Calcula el impacto causal de la adopción de IA en las puntuaciones de IE.

Un ejemplo gráfico

La siguiente figura muestra las puntuaciones de inteligencia emocional en el eje vertical, mientras que el eje horizontal mide el tiempo. Nuestro tiempo es lineal y se compone de antes y después del tratamiento.

El grupo contrafactual 2 mide lo que habría sucedido si el grupo 2 no hubiera recibido tratamiento. Lo ideal sería medir el grupo contrafactual 2, que son las puntuaciones del grupo 2 en ausencia de tratamiento, y compararlas con las puntuaciones observadas para el grupo 2, o las observadas una vez que el grupo recibe tratamiento. (Este es el problema principal en la inferencia causal, no podemos observar el mismo grupo con y sin tratamiento).

Si nos vemos tentados a hacer una comparación ingenua entre los resultados del Grupo 1 y el Grupo 2 después del tratamiento, obtendríamos una estimación que no sería correcta, sino que estaría sesgada, es decir, delta MCO en la figura.

El estimador de diferencias en diferencias nos permite estimar el efecto causal de la adopción de IA, mostrado geométricamente en la figura como delta ATT.

El gráfico indica que las escuelas en las que los estudiantes tenían puntuaciones de inteligencia emocional más bajas adoptaron inicialmente la IA. Después del tratamiento, las puntuaciones del grupo de tratamiento casi alcanzaron las del grupo de control, donde la puntuación media de IE era más alta en el período anterior. El gráfico sugiere que, en ausencia del tratamiento, las puntuaciones habrían aumentado en ambos grupos (tendencias paralelas comunes). Sin embargo, con el tratamiento, la brecha en las puntuaciones entre el Grupo 2 y el Grupo 1 se está cerrando.