Profundizando en la prueba F para modelos anidados con algoritmos, ejemplos y código

Al analizar datos, a menudo es necesario comparar dos modelos de regresión para determinar cuál se ajusta mejor a un dato. A menudo, un modelo es un más simple versión de un mas complejo modelo que incluye parámetros adicionales. Sin embargo, más parámetros no siempre garantizan que un modelo más complejo sea realmente mejor, ya que simplemente podrían sobreajustar los datos.

Para determinar si la complejidad añadida es estadísticamente significativopodemos usar lo que se llama Prueba F para modelos anidados. Esta técnica estadística evalúa si la reducción en la suma residual de cuadrados (RSS) debido a los parámetros adicionales es significativa o simplemente se debe al azar.

En este artículo explico la prueba F para modelos anidados y luego presento un algoritmo paso a paso, demuestro su implementación usando pseudocódigo y proporciono código Matlab que puede ejecutar de inmediato o volver a implementar en su sistema favorito (aquí). Elegí Matlab porque me daba acceso rápido a estadísticas y funciones de ajuste, en las que no quería perder tiempo). A lo largo del artículo veremos ejemplos de la prueba F para modelos anidados en funcionamiento en un par de configuraciones, incluidos algunos ejemplos que incorporé al código de ejemplo de Matlab.

Por automata