Descubra el poder de t-SNE para visualizar datos de alta dimensión, con una implementación de Python paso a paso y explicaciones detalladas.
Para entrenar modelos robustos de aprendizaje automático, se requieren grandes conjuntos de datos con muchas dimensiones para reconocer estructuras suficientes y ofrecer las mejores predicciones posibles. Sin embargo, estos datos de múltiples dimensiones son difíciles de visualizar y comprender. Por eso, se necesitan métodos de reducción de dimensiones para visualizar estructuras de datos complejas y realizar un análisis.
La incrustación estocástica de vecinos distribuida en t (t-SNE/tSNE) es un método de reducción de dimensión que se basa en las distancias entre los puntos de datos e intenta mantener estas distancias en dimensiones más bajas. Es un método del campo de la aprendizaje no supervisado y también es capaz de separar datos no lineales, es decir, datos que no se pueden dividir por una línea.
Varios algoritmos, como regresión linealtiene problemas si el conjunto de datos contiene variables que son correlacionadoes decir, que dependen unas de otras. Para evitar este problema, puede tener sentido eliminar del conjunto de datos las variables que se correlacionan…