Puede ser un tema aterrador para las personas.
Muchos de ustedes quieren trabajar en el aprendizaje automático, pero las habilidades matemáticas necesarias pueden parecer abrumadoras.
Estoy aquí para decirle que no es tan intimidante como puede pensar y para darle una hoja de ruta, recursos y consejos sobre cómo aprender matemáticas de manera efectiva.
¡Vamos a entrar en ello!
¿Necesitas matemáticas para el aprendizaje automático?
A menudo me preguntan:
¿Necesita saber que las matemáticas funcionan en el aprendizaje automático?
La respuesta corta es generalmente Sípero la profundidad y el alcance de las matemáticas que necesita saber depende del tipo de papel que busque.
Un papel basado en la investigación como:
- Ingeniero de Investigación –Ingeniero que ejecuta experimentos basados en ideas de investigación.
- Científico de investigación –Un investigador a tiempo completo sobre modelos de vanguardia.
- Científico de investigación aplicada– En algún lugar entre la investigación y la industria.
En particular, necesitará fuertes habilidades matemáticas.
También depende de para qué empresa trabaje. Si usted es ingeniero de aprendizaje automático o científico de datos o algún papel tecnológico en:
- Profundo
- Microsoft AI
- Meta investigación
- Investigación de Google
También necesitará fuertes habilidades matemáticas porque está trabajando en un laboratorio de investigación, similar a un laboratorio de investigación universitaria o universitario.
De hecho, la mayoría de los aprendizaje automático y la investigación de IA se realizan en grandes corporaciones en lugar de universidades debido a los costos financieros de administrar modelos en datos masivos, que pueden ser de millones de libras.
Para estos roles y puestos que he mencionado, sus habilidades matemáticas deberán ser un mínimo de una licenciatura en una materia como matemáticas, física, informática, estadísticas o ingeniería.
Sin embargo, idealmente, tendrá una maestría o doctorado en una de esas materias, ya que estos títulos enseñan las habilidades de investigación necesarias para estos roles o empresas basadas en la investigación.
Esto puede sonar alentador para algunos de ustedes, pero esto es solo la verdad de las estadísticas.
Según un computadora portátil desde 2021 Kaggle Machine Learning & Data Science Surveyel papel científico de investigación es muy popular entre el doctorado y los doctorados.
Y en general, cuanto mayor sea su educación, más dinero ganará, lo que se correlacionará con el conocimiento de las matemáticas.
Sin embargo, si desea trabajar en la industria en proyectos de producción, las habilidades matemáticas necesarias son considerablemente menores. Muchas personas que conozco que trabajan como ingenieros de aprendizaje automático y científicos de datos no tienen un fondo “objetivo”.
Esto se debe a que la industria no es tan “investigación” intensiva. A menudo se trata de determinar la estrategia o decisión comercial óptima y luego implementarla en un modelo de aprendizaje automático.
A veces, solo se requiere un motor de decisión simple, y el aprendizaje automático sería excesivo.
El conocimiento matemático de la escuela secundaria suele ser suficiente para estos roles. Aún así, es posible que deba repasar las áreas clave, particularmente para entrevistas o especialidades específicas como el aprendizaje de refuerzo o las series de tiempo, que son bastante intensivas en matemáticas.
Para ser honesto, la mayoría de los roles están en la industria, por lo que las habilidades matemáticas necesarias para la mayoría de las personas no estarán a nivel de doctorado o maestría.
Pero estaría mintiendo si dijera que estas calificaciones no te dan una ventaja.
Hay tres áreas centrales que necesita saber:
Estadística
Puedo estar ligeramente sesgado, pero las estadísticas son el área más importante que debe conocer y poner el mayor esfuerzo en la comprensión.
La mayoría del aprendizaje automático se originó en la teoría del aprendizaje estadístico, por lo que las estadísticas de aprendizaje significarán que aprenderá inherentemente el aprendizaje automático o sus conceptos básicos.
Estas son las áreas que debe estudiar:
- Estadística descriptiva– Esto es útil para el análisis general y el diagnóstico de sus modelos. Se trata de resumir y retratar sus datos de la mejor manera.
- Promedios: medio, mediana, modo
- Diferencia: desviación estándar, varianza, covarianza
- Rapas: barra, línea, pastel, histogramas, barras de error
- Distribuciones de probabilidad– Este es el corazón de las estadísticas, ya que define la forma de la probabilidad de los eventos. Hay muchas, muchas distribuciones, pero ciertamente no necesitas aprenderlas todas.
- Normal
- Binomio
- Gama
- Logaro
- Poisson
- Geométrico
- Teoría de la probabilidad– Como dije anteriormente, el aprendizaje automático se basa en el aprendizaje estadístico, que proviene de comprender cómo funciona la probabilidad. Los conceptos más importantes son
- Estimación de máxima probabilidad
- Teorema de límite central
- Estadísticas bayesianas
- Prueba de hipótesis—En los casos de uso del mundo real de los datos y el aprendizaje automático giran en torno a las pruebas. Probará sus modelos en producción o realizará una prueba A/B para sus clientes; Por lo tanto, comprender cómo ejecutar pruebas de hipótesis es muy importante.
- Nivel de significancia
- Prueba z
- Prueba t
- Prueba de chi-cuadrado
- Muestreo
- Modelado e inferencia—Modelos como la regresión lineal, la regresión logística, la regresión polinomial y cualquier algoritmo de regresión originalmente provino de estadísticas, no aprendizaje automático.
- Regresión lineal
- Regresión logística
- Regresión polinómica
- Modelo de residuos
- Incertidumbre del modelo
- Modelos lineales generalizados
Cálculo
La mayoría de los algoritmos de aprendizaje automático aprenden de la descendencia de gradiente de una forma u otra. Y, el descenso de gradiente tiene sus raíces en el cálculo.
Hay dos áreas principales en el cálculo que debe cubrir:
Diferenciación
- ¿Qué es un derivado?
- Derivados de funciones comunes.
- Punto de inflexión, máximos, mínimos y puntos de silla de montar.
- Derivados parciales y cálculo multivariable.
- Reglas de cadena y producto.
- Funciones diferenciables convexas vs no convexas.
Integración
- ¿Qué es la integración?
- Integración por piezas y sustitución.
- La integral de las funciones comunes.
- Integración de áreas y volúmenes.
Álgebra lineal
El álgebra lineal se usa en todas partes en el aprendizaje automático y mucho en el aprendizaje profundo. La mayoría de los modelos representan datos y características como matrices y vectores.
- Vectores
- ¿Qué son los vectores?
- Magnitud, dirección
- Producto de punto
- Producto vectorial
- Operaciones vectoriales (adición, resta, etc.)
- Matrices
- ¿Qué es una matriz?
- Rastro
- Inverso
- Transponer
- Determinantes
- Producto de punto
- Descomposición de matriz
- Valores propios y vectores propios
- Encontrar vectores propios
- Descomposición de valor propio
- Análisis de espectro
Hay muchos recursos, y realmente se reduce a su estilo de aprendizaje.
Si está después de los libros de texto, entonces no puede equivocarse con lo siguiente y es más o menos todo lo que necesita:
- Estadísticas prácticas para científico de datos– Recomiendo este libro todo el tiempo y por una buena razón. Este es el único libro de texto que realista de manera realista para aprender las estadísticas para Ciencia de datos y aprendizaje automático.
- Matemáticas para el aprendizaje automático – Como su nombre lo indica, este libro de texto enseñará las matemáticas para el aprendizaje automático. Gran parte de la información en este libro puede ser exagerada, pero sus habilidades matemáticas serán excelentes si estudia todo.
Si desea algunos cursos en línea, he escuchado cosas buenas sobre los siguientes.
Consejo de aprendizaje
La cantidad de contenido de matemáticas que necesita aprender puede parecer abrumadora, pero no se preocupe.
Lo principal es desglosarlo paso a paso.
Elija uno de los tres: estadísticas, Álgebra linealo cálculo.
Mire las cosas que escribí anteriormente que necesita saber y elegir un recurso. No tiene que ser ninguno de los que recomendé anteriormente.
Ese es el trabajo inicial realizado. No se complique en exceso buscando el “mejor recurso” porque tal cosa no existe.
Ahora, comience a trabajar a través de los recursos, pero no solo lea o vea ciegamente los videos.
Tome activamente notas y documente su comprensión. Personalmente escribo publicaciones de blog, que esencialmente emplean el Técnica de feynman como soy, en cierto modo, “enseñando” a otros lo que sé.
Escribir blogs puede ser demasiado para algunas personas, así que asegúrese de tener buenas notas, ya sea física o digitalmente, que estén en sus propias palabras y que pueda hacer referencia más tarde.
El proceso de aprendizaje es generalmente bastante simple, y se han realizado estudios sobre cómo hacerlo de manera efectiva. La esencia general es:
- Haz un poco todos los días
- Revise los conceptos antiguos con frecuencia (repetición espaciada)
- Documente su aprendizaje
Se trata del proceso; ¡Síguelo y aprenderá!
Únete a mi boletín gratuito, Repartir los datosdonde comparto consejos semanales, ideas y consejos de mi experiencia como práctica Aprendizaje automáticoingeniero. Además, como suscriptor, obtendrás mi ¡Plantilla gratuita de ciencia de datos / aprendizaje automático!
Disparar los datos | Egor Howell | Sustitución
Consejos y aprendizajes sobre ciencia de datos, tecnología y emprendimiento. Haga clic para leer Disparar los datos, por Egor Howell, A …Newsletter.egorhowell.com