días, títulos de trabajo como científico de datos, ingeniero de aprendizaje automáticoy Ingeniero de IA están en todas partes, y si fueras como yo, puede ser difícil entender lo que cada uno de ellos realmente hace si no estás trabajando dentro del campo.
Y luego hay títulos que suenan aún más confusos, como ingeniero robótico cuántico blockchain llm (Está bien, lo inventé, pero entiendes el punto).
El mercado laboral está lleno de palabras de moda y roles superpuestos, lo que puede dificultar saber dónde comenzar si está interesado en una carrera en el aprendizaje automático.
En este artículo, desglosaré los mejores roles de aprendizaje automático y explicaré lo que cada uno implica, además de lo que necesita hacer para prepararse para ellos.
Científico de datos
¿Qué es?
Un científico de datos es el papel más conocido, pero tiene la mayor gama de responsabilidades laborales.
En general, hay dos tipos de científicos de datos:
- Análisis y centrado en el experimento.
- El aprendizaje automático y el modelado enfocado.
El primero incluye cosas como ejecutar pruebas A/B, realizar inmersiones profundas para determinar dónde podría mejorar el negocio y sugerir mejoras en los modelos de aprendizaje automático identificando sus puntos ciegos. Gran parte de este trabajo se llama análisis de datos explicativos o EDA para abreviar.
Este último se trata principalmente de construir modelos de aprendizaje automático POC y sistemas de decisión que beneficien al negocio. Luego, trabajando con ingenieros de software y aprendizaje automático, para implementar esos modelos para producir y monitorear su rendimiento.
Muchos de los algoritmos de aprendizaje automático generalmente estarán en el lado más simple y serán supervisados regularmente y modelos de aprendizaje sin supervisión, como:
- Xgboost
- Regresión lineal y logística
- Bosque al azar
- Clúster K-means
Era científico de datos en mi antigua empresa, pero principalmente construí modelos de aprendizaje automático y no ejecuté muchas pruebas o experimentos A/B. Ese fue el trabajo realizado por analistas de datos y analistas de productos.
Sin embargo, en mi compañía actual, los científicos de datos no construyen modelos de aprendizaje automático, pero principalmente realizan análisis de inmersión profunda y miden experimentos. El desarrollo del modelo lo realiza principalmente ingenieros de aprendizaje automático.
Todo realmente se reduce a la empresa. Por lo tanto, es realmente importante que lea la descripción del trabajo para asegurarse de que sea el trabajo adecuado para usted.
¿Qué usan?
Como científico de datos, estas son generalmente las cosas que necesita saber (no es exhaustiva y variará según el rol):
- Python y SQL
- Git y Github
- Línea de comando (Bash y Zsh)
- Estadística y conocimiento de matemáticas
- Habilidades básicas de aprendizaje automático
- Un poco de sistemas de nubes (AWS, Azure, GCP)
Tengo hojas de ruta para convertirme en un científico de datos que puede consultar a continuación si este rol le interesa.
Ingeniero de aprendizaje automático
¿Qué es?
Como sugiere el título, un ingeniero de aprendizaje automático se trata de construir modelos de aprendizaje automático e implementarlos en sistemas de producción.
Originalmente vino de la ingeniería de software, pero ahora es su propio trabajo/título.
La distinción significativa entre los ingenieros de aprendizaje automático y los científicos de datos es que los ingenieros de aprendizaje automático implementan los algoritmos.
Como practicante de IA/ML líder Chip huyen lo dice:
El objetivo de la ciencia de datos es Generar ideas comercialesmientras que el objetivo de ML Ingeniería es convertir los datos en productos.
Encontrará que los científicos de datos a menudo provienen de una fuerte matemática, estadísticas o antecedentes económicos, y los ingenieros de aprendizaje automático provienen más de los orígenes de la ciencia y la ingeniería.
Sin embargo, hay una gran superposición en este rol, y algunas compañías pueden agrupar los puestos de científico de datos y ingeniero de aprendizaje automático en un solo trabajo, con frecuencia con el título de científico de datos.
El trabajo del ingeniero de aprendizaje automático generalmente se encuentra en empresas tecnológicas más establecidas; Sin embargo, lentamente se está volviendo más popular con el tiempo.
También existen más especialidades dentro del rol de ingeniero de aprendizaje automático, como:
- Ingeniero de plataforma de ML
- Ingeniero de hardware de ML
- ML Arquitecto de soluciones
No se preocupe por esto si usted es un principiante, ya que son bastante nicho y solo relevantes después de unos años de experiencia en el campo. Solo quería agregarlos para que conozcas las diversas opciones que existen.
¿Qué usan?
La pila de tecnología es bastante similar para los ingenieros de aprendizaje automático como para los científicos de datos, pero tiene más elementos de ingeniería de software:
- Python y SQL, sin embargo, algunas compañías pueden requerir otros idiomas. Por ejemplo, en mi rol actual, se necesita óxido.
- Git y Github
- Bash y Zsh
- AWS, Azure o GCP
- Fundamentos de ingeniería de software como CI/CD, MLOPS y Docker.
- Excelente conocimiento de aprendizaje automático, idealmente una especialidad en un área.
Ingeniero de IA
¿Qué es?
Este es un nuevo título que surgió con toda la exageración de la IA que está sucediendo ahora, y para ser honesto, creo que es un título extraño y no es realmente necesario. A menudo, un ingeniero de aprendizaje automático hará el papel de un ingeniero de IA en la mayoría de las empresas.
La mayoría de los roles de ingenieros de IA son en realidad sobre Genai, no de IA en su conjunto. Esta distinción normalmente no tiene sentido para las personas fuera de la industria.
Sin embargo, AI abarca casi cualquier algoritmo de toma de decisiones y es más grande que el campo de aprendizaje automático.
La definición actual de un ingeniero de IA es alguien que trabaja principalmente con las herramientas LLM y Genai para ayudar al negocio.
No necesariamente desarrollan los algoritmos subyacentes desde cero, principalmente porque es difícil de hacer a menos que esté en un laboratorio de investigación, y muchos de los principales modelos son de código abierto, por lo que no necesita reinventar la rueda.
En cambio, se centran en adaptar y construir primero el producto, luego preocuparse por el modelo ajustado después. Entonces, ellos Wu
Está mucho más cerca de la ingeniería de software tradicional que el rol de ingeniero de aprendizaje automático como está actualmente. Aunque muchos ingenieros de aprendizaje automático funcionarán como ingenieros de IA, el trabajo es nuevo y aún no está completamente desarrollado.
¿Qué usan?
Este papel está evolucionando bastante, pero en general, necesita un buen conocimiento de todas las últimas tendencias de Genai y LLM:
- Habilidades sólidas de ingeniería de software
- Python, SQL y Backend Langauges como Java o Go son útiles
- CI/CD
- Git
- LLMS y Transformers
- TRAPO
- Ingeniería rápida
- Modelos fundamentales
- Sintonia FINA
También le recomiendo que consulte el ingeniero de IA Associates AI de Datacamp para la pista de científicos de datos, que también lo preparará bien para una carrera como científico de datos. Esto está vinculado en la descripción a continuación.
Investigador de científico/ingeniero
¿Qué es?
Los roles anteriores fueron principalmente posiciones de la industria, pero estos los próximos dos estarán basados en la investigación.
Los roles de la industria se asocian principalmente con los negocios y se trata de generar valor comercial. Ya sea que use regresión lineal o un modelo de transformador, lo que importa es el impacto, no necesariamente el método.
La investigación tiene como objetivo expandir las capacidades de conocimiento actuales teórica y prácticamente. Este enfoque gira en torno al método científico y los experimentos profundos en un campo de nicho.
La diferencia entre lo que es la investigación y la industria es vaga y a menudo se superpone. Por ejemplo, muchos de los principales laboratorios de investigación son en realidad grandes empresas tecnológicas:
- Meta investigación
- Google AI
- Microsoft AI
Estas compañías inicialmente comenzaron a resolver problemas comerciales, pero ahora tienen sectores de investigación dedicados, por lo que puede trabajar en problemas de la industria y la investigación. Donde uno comienza y el otro final no siempre está claro.
Si está interesado en explorar las diferencias entre la investigación y la industria más profundamente, le recomiendo que lea este documento. Es la primera conferencia de CS 329S de Stanford, Conferencia 1: Comprensión de la producción de aprendizaje automático.
En general, hay más posiciones de la industria que la investigación, ya que solo las grandes empresas pueden pagar los datos y los costos informáticos.
De todos modos, como ingeniero de investigación o científico, esencialmente estará trabajando en la investigación de vanguardia, empujando los límites del conocimiento del aprendizaje automático.
Hay una ligera distinción entre los dos los trabajos. Como científico de investigación, necesitará un doctorado, pero esto no es necesariamente cierto para un ingeniero de investigación.
Un ingeniero de investigación generalmente implementa los detalles e ideas teóricos del científico de la investigación. Este papel suele ser en general empresas de investigación establecidas; Sin embargo, en la mayoría de las situaciones, el ingeniero de investigación y los trabajos científicos son los mismos.
Las empresas pueden ofrecer el título del científico de investigación, ya que le brinda más “influencia” y lo hace más probable que tome el trabajo.
¿Qué usan?
Este es similar a la ingeniería de aprendizaje automático, pero la profundidad del conocimiento y las calificaciones a menudo es mayor.
- Python y SQL
- Git y Github
- Bash y Zsh
- AWS, Azure o GCP
- Fundamentos de ingeniería de software como CI/CD, MLOPS y Docker.
- Excelente conocimiento del aprendizaje automático y una especialidad en un área de vanguardia como visión por computadora, aprendizaje de refuerzo, LLM, etc.
- Doctorado o al menos una maestría en una disciplina relevante.
- Experiencia de investigación.
Este artículo acaba de rascar la superficie de los roles de aprendizaje automático, y hay muchos más trabajos de nicho y especialismo dentro de estos cuatro o cinco que mencioné.
Siempre recomiendo comenzar su carrera poniendo el pie en la puerta y luego pivotando a la dirección en la que desea ir. Esta estrategia es mucho más efectiva que la visión del túnel para un solo papel.
¡Otra cosa!
Ofrezco llamadas de coaching 1: 1 donde podemos charlar sobre lo que necesite, ya sean proyectos, Consejo profesionalo simplemente descubrir su próximo paso. ¡Estoy aquí para ayudarte a avanzar!
Llamada de tutoría 1: 1 con Egor Howell
Orientación profesional, asesoramiento laboral, ayuda del proyecto, revisión de reanudarTopmate.io