Todo científico de datos debería tener SVM en su caja de herramientas. Aprenda a dominar este modelo versátil con una introducción práctica.
Entre los modelos de Machine Learning disponibles existe uno cuya versatilidad lo convierte en una herramienta imprescindible para cada caja de herramientas del científico de datos: Máquinas de vectores soporte (SVM).
SVM es un algoritmo potente y versátil que, en esencia, puede delinear hiperplanos óptimos en un espacio de alta dimensión, efectivamente segregando las diferentes clases de un conjunto de datos. ¡Pero esto no termina aquí! Su eficacia no se limita a clasificación tareas: SVM es adecuado incluso para regresión y detección de valores atípicos tareas.
Una característica hace que el enfoque SVM sea particularmente efectivo. En lugar de procesar todo el conjunto de datos, como KNN hace, SVM se centra estratégicamente sólo en el subconjunto de puntos de datos ubicados cerca de los límites de decisión. Estos puntos se llaman vectores de apoyoy las matemáticas detrás de esta idea única se explicarán de forma sencilla en las próximas secciones.
Al hacerlo, Support Vector Machine es computacionalmente conservador e ideal para tareas que involucran conjuntos de datos medianos o incluso medianamente grandes.
Como hago en todos mis artículos, no solo explicaré los conceptos teóricos, sino que también te brindaré ejemplos de codificación para familiarizarse con el Scikit-Aprende (aprender) Pitón biblioteca.
En esencia, la clasificación SVM se asemeja a la elegante simplicidad del álgebra lineal. Imagine un conjunto de datos en un espacio bidimensional, con dos clases distintas que deben separarse. Linear SVM intenta separar las dos clases con la mejor línea recta posible.
¿Qué significa “mejor” en este contexto? SVM busca la línea de separación óptima: una línea que no sólo separe las clases, sino que lo haga con la máxima distancia posible de las instancias de entrenamiento más cercanas de cada clase. esa distancia se llama margen. Los puntos de datos que se encuentran en el borde del margen son…