0izc28o7zuu4nc0r3.jpeg

Es una técnica de estimación muy flexible que se puede aplicar en una variedad de situaciones.

Foto por Shubham Dhage en desempaquetar

Hansen (1982) fue pionero en la introducción del método generalizado de momentos (GMM), haciendo contribuciones notables a la investigación empírica en finanzas, particularmente en la fijación de precios de activos. La creación del modelo fue motivada por la necesidad de estimar parámetros en modelos económicos respetando las restricciones teóricas implícitas en el modelo. Por ejemplo, si el modelo económico establece que dos cosas deben ser independientes, el GMM intentará encontrar una solución en la que el promedio de su producto sea cero. Por lo tanto, comprender GMM puede ser una poderosa alternativa para quienes necesitan un modelo en el que las condiciones teóricas sean extremadamente importantes, pero que los modelos convencionales no pueden satisfacer debido a la naturaleza de los datos.

Esta técnica de estimación se utiliza ampliamente en econometría y estadística para abordar la endogeneidad y otras cuestiones en el análisis de regresión. El concepto básico del estimador GMM implica minimizar una función de criterio eligiendo parámetros que acerquen los momentos muestrales de los datos lo más posible a los momentos poblacionales. La ecuación del Estimador Básico GMM se puede expresar de la siguiente manera:

El estimador GMM tiene como objetivo encontrar el vector de parámetros θ que minimice esta función de criterio, asegurando así que los momentos muestrales de los datos se alineen lo más cerca posible con los momentos poblacionales. Al optimizar esta función de criterio, el estimador GMM proporciona estimaciones consistentes de los parámetros en los modelos econométricos.

Ser consistente significa que a medida que el tamaño de la muestra se acerca al infinito, el estimador converge en probabilidad al valor verdadero del parámetro (asintóticamente normal). Esta propiedad es crucial para garantizar que el estimador proporcione estimaciones confiables a medida que aumenta la cantidad de datos. Incluso en presencia de variables omitidas, siempre que las condiciones de momento sean válidas y los instrumentos estén especificados correctamente, GMM puede proporcionar estimadores consistentes. Sin embargo, la omisión de variables relevantes puede afectar la eficiencia y la interpretación de los parámetros estimados.

Para ser eficiente, GMM utiliza mínimos cuadrados generalizados (GLS) en momentos Z para mejorar la precisión y eficiencia de las estimaciones de parámetros en modelos econométricos. GLS aborda la heterocedasticidad y la autocorrelación ponderando las observaciones en función de su varianza. En GMM, los momentos Z se proyectan en el espacio de columnas de variables instrumentales, similar al enfoque GLS. Esto minimiza la variación y mejora la precisión de la estimación de parámetros al centrarse en los momentos Z y aplicar técnicas GLS.

Sin embargo, es importante reconocer que el estimador GMM está sujeto a una serie de supuestos que deben ser considerados durante su aplicación, los cuales se han enumerado:

  • Existencia de Momentos: Hasta cierto orden es necesario y requiere colas finitas en la distribución de los datos.
  • Especificación correcta del modelo: el modelo subyacente debe especificarse correctamente, incluida la relación funcional y la distribución de los términos de error.
  • Identificabilidad: Debe existir una solución única para los parámetros a estimar.
  • Condiciones de momento: Es necesario especificar correctamente las condiciones de momento, las cuales deben tener media cero según los supuestos del modelo.
  • Instrumentos válidos: Si corresponde, los instrumentos deben ser relevantes y válidos.
  • Independencia y homocedasticidad (condicional): idealmente, los errores deberían ser independientes y homocedásticos en las condiciones del momento.
  • Robustez a la heteroscedasticidad: GMM es robusto a la heteroscedasticidad si la matriz de ponderación se estima consistentemente.
  • Multicolinealidad: GMM puede manejar la multicolinealidad, pero puede afectar la eficiencia de los estimadores.
  • Valores atípicos: GMM es sensible a los valores atípicos a menos que se aborden adecuadamente en el proceso de modelado.
  • Muestras grandes: GMM es más eficiente en muestras grandes.
  • Teoría asintótica: propiedades como la consistencia y la eficiencia son asintóticas.

Por lo tanto, GMM es una técnica de estimación altamente flexible y puede aplicarse en una variedad de situaciones, siendo ampliamente utilizada como técnica de estimación de parámetros en econometría y estadística. Permite una estimación eficiente de parámetros bajo diferentes especificaciones de modelo y estructuras de datos. Sus principales usos son:

  • Modelos con Variables Instrumentales: se utilizan cuando hay variables endógenas en un modelo. Proporciona una manera de corregir el sesgo en la estimación de parámetros cuando las variables explicativas se correlacionan con el error.
  • Modelos con errores de medición: GMM se puede utilizar para corregir el sesgo introducido por errores de medición en variables.
  • Modelos con restricciones de momento: en algunas situaciones, existen múltiples condiciones de momento que un modelo debe satisfacer. GMM le permite utilizar toda esta información simultáneamente para una estimación más eficiente.
  • Modelos de series temporales: GMM se aplica a menudo en modelos ARMA (media móvil autorregresiva) y otros modelos de series temporales.
  • Modelos de datos de panel: se puede utilizar en modelos de datos de panel para manejar cuestiones como la heterocedasticidad y la autocorrelación dentro de unidades transversales.
  • Modelos no lineales: GMM también se puede extender a modelos no lineales, lo que proporciona una técnica de estimación sólida cuando los métodos clásicos como Máxima Verosimilitud pueden no ser factibles.

El contraste entre el método de Mínimos Cuadrados Ordinarios (OLS) y el Método Generalizado de Momentos (GMM) señala diferentes ventajas. OLS demuestra ser eficiente bajo los supuestos clásicos de linealidad, sirviendo como un estimador lineal insesgado de varianza mínima (BLUE). Los supuestos fundamentales de un modelo de regresión lineal incluyen: linealidad en la relación entre variables, ausencia de multicolinealidad perfecta, error medio cero, homocedasticidad (varianza constante de los errores), no autocorrelación de los errores y normalidad de los errores. Por tanto, MCO es un estimador insesgado, consistente y eficiente. Además, tiene una complejidad computacional relativamente menor.

Sin embargo, GMM proporciona más flexibilidad, que es aplicable a una amplia gama de contextos, como modelos con errores de medición, variables endógenas, heterocedasticidad y autocorrelación. No hace suposiciones sobre la distribución de errores y es aplicable a modelos no lineales. GMM se destaca en los casos en los que hemos omitido variables importantes, múltiples condiciones de momento, modelos no lineales y conjuntos de datos con heterocedasticidad y autocorrelación.

Por el contrario, al comparar GMM y la estimación de máxima verosimilitud (MLE), se destacan sus enfoques para manejar los supuestos de datos. GMM construye estimadores utilizando datos y condiciones de momento poblacional, proporcionando flexibilidad y adaptabilidad a modelos con menos supuestos, particularmente ventajoso cuando los supuestos sólidos sobre la distribución de datos pueden no ser válidos.

MLE estima los parámetros maximizando la probabilidad de los datos dados, dependiendo de suposiciones específicas sobre la distribución de los datos. Si bien MLE funciona de manera óptima cuando la distribución supuesta se alinea estrechamente con el verdadero proceso de generación de datos, GMM se adapta a varias distribuciones, lo que resulta valioso en escenarios donde los datos pueden no ajustarse a una única distribución específica.

En el ejemplo hipotético demostrado en Python, utilizamos la biblioteca linearmodels.iv para estimar un modelo GMM con la función IVGMM. En este modelo, el consumo sirve como variable dependiente, mientras que la edad y el género (representados como una variable ficticia para los hombres) se consideran variables exógenas. Además, asumimos que el ingreso es una variable endógena, mientras que el número de hijos y el nivel educativo son variables instrumentales.

import pandas as pd
from linearmodels.iv import IVGMM

# Read the Excel file
df = pd.read_excel('example.xlsx')

# Dependent variable
dependent = 'YConsumption'

# Exogenous variables
exog_vars = ['XAge', 'XMale1']

# Endogenous variable
endog_vars = ['XIncomeEndo']

# Instrumental variables
instruments = ['ZChildQuantity6', 'ZEducation']

# Construct the formula for GMM
formula = "{dep} ~ 1 + {exog} + [{endog} ~ {instr}]".format(
dep=dependent,
exog='+'.join(exog_vars),
endog=endog_vars[0],
instr='+'.join(instruments)
)

# Estimate the GMM model
model = IVGMM.from_formula(formula, df)
result = model.fit(cov_type='robust')

# Displaying GMM results
print(result)

Las variables instrumentales en los modelos GMM se utilizan para abordar cuestiones de endogeneidad proporcionando una fuente de variación exógena que está correlacionada con los regresores endógenos pero no correlacionada con el término de error. La función IVGMM está diseñada específicamente para estimar modelos en los que se utilizan variables instrumentales en el marco de GMM.

Por lo tanto, al especificar el consumo como la variable dependiente y emplear variables exógenas (edad y género) junto con variables instrumentales (número de hijos y educación) para abordar la endogeneidad, este ejemplo encaja dentro del contexto del GMM.