Aprender a transformar datos categóricos en un formato que un modelo de aprendizaje automático pueda comprender
Al estudiar el aprendizaje automático, es fundamental comprender el funcionamiento interno de los algoritmos más básicos. Hacerlo ayuda a comprender cómo funcionan los algoritmos en bibliotecas y marcos populares, cómo depurarlos, elegir mejores hiperparámetros más fácilmente y determinar qué algoritmo es mejor para un problema determinado.
Si bien los algoritmos son el núcleo del aprendizaje automático, no pueden producir resultados efectivos sin datos de alta calidad. Dado que los datos pueden ser un recurso escaso en algunos problemas, es fundamental aprender a preprocesarlos de forma eficaz para extraer el máximo valor. Además, los datos preprocesados incorrectamente pueden deteriorar el rendimiento de un algoritmo.
En este artículo, examinaremos la codificación one-hot, una de las técnicas más fundamentales utilizadas para el preprocesamiento de datos. Para hacer esto de manera efectiva, primero comprenderemos la motivación detrás de la codificación de datos en general y luego exploraremos sus principios y…