Las “predicciones aproximadas” hacen que la selección de funciones sea radicalmente más rápida |  de Samuele Mazzanti |  noviembre de 2023

La selección de funciones es muy lenta porque requiere la creación de muchos modelos. Descubra cómo hacerlo increíblemente más rápido gracias a las predicciones aproximadas

[Image by Author]

Al desarrollar un modelo de aprendizaje automático, normalmente comenzamos con un gran conjunto de características resultantes de nuestros esfuerzos de ingeniería de características.

La selección de funciones es el proceso de elegir un subconjunto más pequeño de funciones que sean óptimas para nuestro modelo ML..

¿Por qué hacer eso y no simplemente conservar todas las funciones?

  • Memoria. Los grandes datos ocupan un gran espacio. Eliminar funciones significa que necesita menos memoria para manejar sus datos. A veces también existen limitaciones externas.
  • Tiempo. Volver a entrenar un modelo con menos datos puede ahorrarle mucho tiempo.
  • Exactitud. Menos es más: esto también se aplica al aprendizaje automático. Incluir funciones redundantes o irrelevantes significa incluir ruido innecesario. Con frecuencia sucede que un modelo entrenado con menos datos funciona mejor.
  • Explicabilidad. Un modelo más pequeño es más fácilmente explicable.
  • Depuración. Un modelo más pequeño es más fácil de mantener y solucionar problemas.

Ahora bien, el principal problema con la selección de funciones es que es muy lento porque requiere entrenar muchos modelos.

En este artículo veremos un truco que hace que la selección de funciones sea extremadamente rápida gracias a las “predicciones aproximadas”.

Intentemos visualizar el problema de la selección de funciones. Empezamos con norte características, donde norte suele ser cientos o miles.

Por lo tanto, el resultado de la selección de características puede verse como una matriz de longitud norte hecho de “sí”/“no”, donde cada elemento de la matriz nos dice si la característica correspondiente está seleccionada o no.

Salida de la selección de funciones. [Image by Author]

El proceso de selección de características consiste en probar diferentes “candidatos” y finalmente elegir el mejor (según nuestra métrica de desempeño).