La mejor hoja de ruta AI/ML para principiantes

AI está transformando la forma en que operan las empresas, y casi todas las empresas están explorando cómo aprovechar esta tecnología.

Como resultado, la demanda de IA y habilidades de aprendizaje automático se ha disparado en los últimos años.

Con casi cuatro años de experiencia en IA/ML, he decidido crear la mejor guía para ayudarlo a ingresar este campo de rápido crecimiento.

¿Por qué trabajar en AI/ML?

No es ningún secreto que la IA y el aprendizaje automático son algunas de las tecnologías más deseadas hoy en día.

Estar bien versado en estos campos abrirá muchas oportunidades de carrera en el futuro, sin mencionar que estará a la vanguardia del avance científico.

Y para ser franco, se le pagará mucho.

De acuerdo a Nivelesel salario medio para un ingeniero de aprendizaje automático es de £ 93k, y para un ingeniero de IA es de £ 75k. Mientras que para un científico de datos, es de £ 70k, y el ingeniero de software cuesta £ 83k.

No me malinterpreten; Estos son salarios súper altos por su cuenta, pero AI/ML le dará esa ventaja, y la diferencia probablemente crecerá más prominente en el futuro.

Tampoco necesita un doctorado en informática, matemáticas o física para trabajar en AI/ML. Las buenas habilidades de ingeniería y resolución de problemas, junto con una buena comprensión de los conceptos fundamentales de ML, son suficientes.

La mayoría de los trabajos no son trabajos de investigación, sino más soluciones de IA/ML a problemas de la vida real.

Por ejemplo, trabajo como ingeniero de aprendizaje automático, pero no investigo. Mi objetivo es usar algoritmos y aplicarlos a problemas comerciales para beneficiar a los clientes y, por lo tanto, a la empresa.

A continuación se presentan trabajos que usan AI/ML:

  • Ingeniero de aprendizaje automático
  • Ingeniero de IA
  • Investigador científico
  • Ingeniero de investigación
  • Científico de datos
  • Ingeniero de software (AI/ML Focus)
  • Ingeniero de datos (AI/ML Focus)
  • Ingeniero de plataforma de aprendizaje automático
  • Científico aplicado

Todos tienen diferentes requisitos y habilidades, por lo que habrá algo que se adapte bien.

Si desea obtener más información sobre los roles anteriores, le recomiendo leer algunos de mis artículos anteriores.

¿Debería convertirse en científico de datos, analista de datos o ingeniero de datos?
Explicar las diferencias y requisitos entre los diversos roles de datosMedium.com

¡Bien, vamos a entrar en la hoja de ruta!

Matemáticas

Yo diría que las habilidades de matemáticas sólidas son probablemente las más esenciales para cualquier profesional de la tecnología, especialmente si está trabajando con AI/ML.

Necesita una buena conexión a tierra para comprender cómo funcionan los modelos AI y ML debajo del capó. Esto lo ayudará a depurarlos mejor y desarrollar intuición sobre cómo trabajar con ellos.

No me malinterpreten; No necesita un doctorado en física cuántica, pero debe tener conocimiento en las siguientes tres áreas.

  • Álgebra lineal – Para comprender cómo funcionan las matrices, valores propios y vectores, que se usan en todas partes en IA y aprendizaje automático.
  • Cálculo– Para comprender cómo la IA realmente aprende a usar algoritmos como el descenso de gradiente y la backpropagación que utilizan la diferenciación e integración.
  • Estadística – Comprender la naturaleza probabilística de los modelos de aprendizaje automático a través de distribuciones de probabilidad de aprendizaje, inferencia estadística y estadísticas bayesianas.

Recursos:

Esto es más o menos todo lo que necesitas; ¡En todo caso, es un poco exagerado en algunos aspectos!

Línea de tiempo: Dependiendo de los antecedentes, esto debería llevarle un par/pocos meses para ponerse al día.

Tengo desgloses en profundidad de las matemáticas que necesitas para Ciencia de datosque es igualmente aplicable aquí para AI/ML.

Pitón

Python es el estándar de oro y el lenguaje de programación para el aprendizaje automático y la IA.

Los principiantes a menudo quedan atrapados en la llamada “mejor manera” para aprender Python. Cualquier curso introductorio será suficiente, ya que enseñan las mismas cosas.

Las principales cosas que quieres aprender son:

  • Estructuras de datos nativas (diccionarios, listas, conjuntos y tuplas)
  • Para y mientras bucles
  • Declaraciones condicionales if-else
  • Funciones y clases

También desea aprender bibliotecas de computación científica específicas como:

  • Numpy– Computación numérica y matrices.
  • Pandas– Manipulación y análisis de datos.
  • Mate Y Tramamente– Visualización de datos.
  • lear – Implementación de algoritmos ML clásicos.

Recursos:

Línea de tiempo:Nuevamente, dependiendo de sus antecedentes, esto debería llevar un par de meses. Si ya conoce a Python, será mucho más rápido.

Estructuras de datos y algoritmos

Este puede parecer un poco fuera de lugar, pero si desea ser un ingeniero de aprendizaje automático o de IA, debe conocer estructuras y algoritmos de datos.

Esto no es solo para entrevistas; También se usa en algoritmos AI/ML. Encontrarás cosas como retroceso, búsqueda de profundidad y árboles binarios más de lo que piensas.

Las cosas para aprender son:

  • Matrices y listas vinculadas
  • Árboles y gráficos
  • Hashmaps, colas y pilas
  • Algoritmos de clasificación y búsqueda
  • Programación dinámica

Recursos:

  • Neetcode.io– Gran estructura de datos introductoria, intermedia y avanzada y cursos de algoritmos.
  • Código leet Y Truco– Plataformas para practicar.

Línea de tiempo: Alrededor de un mes para clavar lo básico.

Aprendizaje automático

¡Aquí es donde comienza la diversión!

Los cuatro pasos anteriores implicaron preparar su base para abordar el aprendizaje automático.

En general, el aprendizaje automático se encuentra en dos categorías:

  • Aprendizaje supervisado– Donde tenemos etiquetas objetivo para entrenar el modelo.
  • Aprendizaje no supervisado – Cuando no hay etiquetas objetivo.

El siguiente diagrama ilustra esta división y algunos algoritmos en cada categoría.

Diagrama por el autor.

Los algoritmos y conceptos clave que debe aprender son:

  • Regresión lineal, logística y polinómica.
  • Árboles de decisión, bosques aleatorios y árboles de gradiente.
  • Máquinas de vectores de soporte.
  • K-Media y K-Nearest Vecin Clustering.
  • Ingeniería de características.
  • Métricas de evaluación.
  • Regularización, sesgo frente a la compensación de varianza y validación cruzada.

Recursos:

Línea de tiempo:Esta sección es bastante densa, por lo que probablemente tomará aproximadamente ~ 3 meses conocer la mayor parte de esta información. En realidad, llevará años dominar realmente todo en esos recursos.

AI y aprendizaje profundo

Ha habido mucha publicidad en torno a la IA desde que se lanzó ChatGPT en 2022.

Sin embargo, la IA en sí ha existido como un concepto durante mucho tiempo, que se remonta en su forma actual a la década de 1950, cuando el La red neuronal se originó.

La IA a la que nos referimos en este momento se llama específicamente la IA generativa (Genai), que en realidad es un subconjunto bastante pequeño de todo el ecosistema AI como se muestra a continuación.

Imagen del autor.

Como su nombre lo indica, Genai es un algoritmo que genera texto, imágenes, audio e incluso código.

Hasta hace poco, el paisaje de IA estaba dominado por dos modelos principales:

Sin embargo, en 2017, un artículo llamado “La atención es todo lo que necesitas” fue publicado, presentando la arquitectura y el modelo de Transformer, que desde entonces ha reemplazado a CNNS y RNNS.

Hoy, los transformadores son la columna vertebral de los modelos de idiomas grandes (LLM) y gobiernan inequívocamente el paisaje de IA.

Con todo esto en mente, las cosas que debes saber son:

  • Redes neuronalesEl algoritmo que realmente pone ai/ml en el mapa.
  • Redes neuronales convolucionales y recurrentes –Todavía se usa bastante hoy para sus tareas específicas.
  • Transformadores –El estado actual del arte.
  • RAG, Bases de datos de Vector, LLM Tuning Fine –Estas tecnologías y conceptos son cruciales para la infraestructura de IA actual.
  • Aprendizaje de refuerzo– El tercer tipo de aprendizaje utilizado para crear IA como Alfago.

Recursos:

Línea de tiempo:Hay muchas cosas aquí y es una llamada bastante dura y de vanguardia. Entonces, alrededor de 3 meses es probablemente lo que te llevará.

Mlops

Un modelo en un cuaderno de Jupyter no tiene valor, como he dicho muchas veces.

Para que sus modelos AI/ML sean útiles, debe aprender a implementarlos en producción.

Las áreas para aprender son:

  • Tecnologías en la nube como AWS, GCP o Azure.
  • Docker y Kubernetes.
  • Cómo escribir código de producción.
  • Git, Circleci, Bash/Zsh.

Recursos:

  • Mlops prácticos (enlace de afiliado)-Este es probablemente el único libro que necesita para comprender cómo implementar su modelo de aprendizaje automático. Lo uso más como texto de referencia, pero enseña casi todo lo que necesita saber.
  • Diseño de sistemas de aprendizaje automático (enlace de afiliado)– Otro gran libro y recurso para variar su fuente de información.

Trabajos de investigación

La IA está evolucionando rápidamente, por lo que vale la pena mantenerse al día con todos los últimos desarrollos.

Algunos documentos que te recomiendo que leas son:

Puedes encontrar una lista completa aquí.

Conclusión

Romper en AI/ML puede parecer abrumador, pero se trata de darle un paso a la vez.

  • Aprenda los conceptos básicos como PitónMatemáticas y estructuras de datos y algoritmos.
  • Obtenga su aprendizaje de AI/ML de aprendizaje de aprendizaje supervisado, redes neuronales y transformadores.
  • Aprenda a implementar algoritmos AI.

El espacio es ginmous, por lo que probablemente le llevará aproximadamente un año comprender completamente todo en esta hoja de ruta, y eso está bien. Hay literalmente títulos de licenciatura dedicados a este espacio, que llevan tres años,

Simplemente ve a tu propio ritmo y, finalmente, llegarás a donde quieras estar.

¡Feliz aprendizaje!

¡Otra cosa!

Únete a mi boletín gratuito, Repartir los datosdonde comparto consejos semanales, ideas y consejos de mi experiencia como científico de datos en ejercicio. Además, como suscriptor, obtendrás mi Plantilla de currículum de ciencia de datos gratuita!

Disparar los datos | Egor Howell | Sustitución
Consejos y aprendizajes sobre ciencia de datos, tecnología y emprendimiento. Haga clic para leer Disparar los datos, por Egor Howell, A …Newsletter.egorhowell.com

Conéctate conmigo