¿Qué tiene de malo el R cuadrado (y cómo solucionarlo)? | por Samuele Mazzanti | agosto, 2024

R-cuadrado es una de las métricas más populares para evaluar modelos de regresión. Se enseña en cualquier clase de estadística y es una de las métricas implementadas en Aprendizaje de Scikit.

Sin embargo, se han planteado algunas dudas sobre la fiabilidad de esta métrica. Notas para su curso en la Universidad Carnegie Mellon, El profesor Cosma Shalizi afirma que R-cuadrado es inútil.

Entonces, ¿deberíamos descartarlo por completo? R-cuadrado?

No me parece.

Reconozco que esta métrica tiene un defecto importante, pero también creo que no deberíamos perder de vista los aspectos positivos. En este artículo, explicaré qué es lo que está mal con R-cuadradoy sugerir una modificación que lo haga completamente confiable.

Para comprender cuál es el problema con R-cuadradoprimero debemos entender su significado. Y me refiero a El significado más profundo, no las definiciones descuidadas que se pueden encontrar en la mayoría de los recursos..

Comencemos con un ejemplo. Supongamos que tenemos un modelo predictivo (“modelo A”) diseñado para pronosticar el precio de venta de una casa.

Imaginemos que nuestro conjunto de pruebas consta de cuatro casas. Podemos comprobar visualmente…