Lo que me molesta son las innumerables personas en línea, en persona e incluso en mi sección de comentarios que dicen “cómo la IA reemplazará a los científicos de datos”.
Esto me resulta frustrante porque a menudo proviene de personas que no trabajan en este campo y desalienta a quienes serían grandes científicos de datos a seguir esta carrera.
Sin mencionar que estoy firmemente en desacuerdo con este punto de vista y creo que la IA no reemplazará a los científicos de datos, al menos definitivamente no dentro de la próxima década.
Y esto viene de alguien que ha trabajado en este campo durante 5 años en una variedad de empresas y ha visto cómo era la industria antes y después de la IA.
No me preocupa que la IA tome mi trabajo tal como está, y en este artículo quiero explicar exactamente por qué pienso eso y poner fin a todo este alarmismo.
Necesitas aprender IA
Antes de entrar en el “meollo” real del artículo, permítanme comenzar diciendo que no odio completamente la IA.
Utilizo la IA a diario y mejoro constantemente mis habilidades en IA, ya que es una herramienta de productividad increíble para:
Escribir código repetitivo Lluvia de ideas técnicas Crear y redactar documentos Producir visualizaciones de datos y gráficos rápidamente Un gran compañero de entrenamiento intelectual en general
Esta tecnología llegó para quedarse y es necesario aprender a utilizarla; de lo contrario, te quedarás atrás.
La competencia con las herramientas de inteligencia artificial se convertirá en la norma, del mismo modo que hoy en día se espera que todo el mundo utilice el correo electrónico o conozca Microsoft Word.
La IA no reemplazará a los científicos de datos, pero un individuo con menos habilidades técnicas pero mayor dominio de la IA probablemente lo hará.
Como científico de datos, es necesario estar bien versado en herramientas como:
Y muchos más.
Estos se convertirán en elementos básicos de nuestra industria, al igual que Python se ha convertido en la lengua franca del aprendizaje automático.
Es inevitable y debes subir a bordo del barco lo antes posible.
Habrá problemas mayores
Analicemos las habilidades que la IA necesitará desarrollar para reemplazar completamente a los científicos de datos:
Divida los problemas comerciales ambiguos en sistemas o algoritmos matemáticos enmarcados. Comuníquese con partes interesadas no técnicas y explique ciertos resultados con preguntas en vivo. Escriba código de producción sin errores en todo momento para garantizar que todas las decisiones críticas para el negocio se realicen sin problemas. Realice concesiones lógicas y humanas entre la complejidad, el diseño arquitectónico y el proceso de desarrollo. Construya relaciones y confianza entre un equipo, una empresa y una industria.
Si la IA dominara todas estas habilidades a un nivel mejor que un científico de datos actual, ¿qué trabajo no desaparecería?
La mayoría de ellos también se extinguirían.
Si esto sucediera, tendríamos problemas mucho mayores de los que preocuparnos, problemas casi a nivel de singularidad, y su preocupación sobre si debería buscar un trabajo en ciencia de datos palidecerá en comparación.
La singularidad de la IA es un punto teórico futuro en el que la inteligencia artificial superará a la inteligencia humana, lo que conducirá a un crecimiento tecnológico rápido, incontrolable e irreversible.
Si se reemplaza a los científicos de datos, probablemente habrá cosas más importantes en nuestras vidas que simplemente preocuparnos por nuestras carreras.
Falta de razonamiento matemático
Una cosa de la que carece mucho la IA es el razonamiento matemático.
No me refiero a las matemáticas comunes que la mayoría de la gente le pregunta a la IA:
Ayúdame a encontrar el gradiente de esta función. Calcula el determinante de esta matriz. ¿Cuál es la fórmula de los números de Fibonacci?
Lo que quiero decir con “razonamiento matemático” es la capacidad de resolver problemas matemáticos no resueltos.
Por ejemplo, actualmente la IA no puede resolver la hipótesis de Riemann porque carece de la creatividad y el razonamiento conceptual para lograr un avance importante en las matemáticas puras.
La Hipótesis de Riemann es una famosa predicción no resuelta que sugiere que existe un orden subyacente oculto en la distribución aparentemente aleatoria de los números primos. Se centra en los “ceros” de una compleja herramienta matemática llamada Función Zeta de Riemann, que propone que todos los ceros no triviales se encuentran en una única línea vertical (la “línea crítica”).
La hipótesis de Riemann es un ejemplo extremo, ya que posiblemente sea el problema más difícil que existe en este momento.
Sin embargo, muestra que la IA no ha superado a los humanos en habilidades matemáticas, que es la piedra angular de la ciencia de datos.
La mayoría de la gente olvida que estos modelos de IA son en realidad un tipo de modelo llamado modelos de lenguaje grande (LLM), diseñados específicamente para predecir la siguiente palabra a partir de una distribución de probabilidad previamente calculada.
Estos modelos sólo pueden generar, o basar su producción, en datos que han visto; sólo pueden partir de lo que existe y no necesariamente crear algo “nuevo”.
El trabajo de ciencia de datos requiere desarrollar soluciones novedosas a problemas invisibles. De hecho, ¡necesitamos científicos de datos y profesionales del aprendizaje automático para construir estos modelos de IA en primer lugar y mantenerlos!
La IA todavía comete errores
Como alguien que trabaja con estas herramientas todos los días para una variedad de aplicaciones, la IA comete tantos errores que es ridículo.
Estos LLM a menudo “alucinan”, que es un término que probablemente haya escuchado y es cuando estos modelos de IA producen resultados que parecen plausibles pero que en realidad son muy incorrectos.
Esto se debe al hecho de que son modelos probabilísticos por naturaleza y potencialmente pueden “encadenar” palabras que no tienen sentido para satisfacer las demandas o expectativas de los usuarios.
Los humanos también cometemos errores, pero la diferencia es que la mayoría de los humanos son conscientes de sus errores después de corregirlos. Tampoco están muy seguros de su respuesta inicial, dependiendo del escenario.
Mientras que la IA es bastante terca, inteligente y muy segura de las respuestas que te da, lo que psicológicamente nos engaña a nosotros, los humanos, haciéndonos pensar que es correcta.
Imagínese lo discordante que sería esto en un entorno laboral.
Un científico de datos de IA no sería capaz de evaluar con precisión cuán escandaloso o ridículo es su resultado, por lo que no logra establecer expectativas cuando implementa la solución dada.
Se pasa por alto esa falta de matices e intangibles que tenemos los humanos en muchos proyectos de ciencia de datos y aprendizaje automático.
Límite al rendimiento
Lo que me resulta interesante es que estos modelos de IA en realidad no mejoran sustancialmente con el tiempo.
La razón es doble:
El algoritmo subyacente sigue siendo el mismo; Todos estos LLM utilizan la arquitectura Transformer, por lo que cada modelo “nuevo” no es en realidad tan “nuevo”. Existe un límite en la cantidad de datos con los que se pueden entrenar, ya que en el mundo existe una cantidad limitada de información.
Por ejemplo, los modelos GPT de OpenAI se han entrenado básicamente en todo Internet hasta cierto punto, no hay muchos datos “nuevos” para usar.
Hay literalmente un límite a lo buenos que pueden llegar a ser.
Estos datos también provienen de humanos, por lo que no pueden exceder la inteligencia humana; ese es su techo.
Estos modelos de IA no mejorarán a menos que haya un avance científico masivo en el algoritmo subyacente.
Y el hecho de que no mejorarán significa que el estado actual seguirá siendo el mismo y la IA aún no ha reemplazado a los científicos de datos.
No puedo construir relaciones
La IA es incapaz de establecer relaciones, a pesar de cuántas personas, lamentablemente, se están apegando emocionalmente a estos robots.
Los seres humanos son criaturas sociales y la mayoría de las interacciones comerciales del mundo se realizan a través de relaciones.
Las personas hacen negocios, contratan y trabajan con personas que les agradan, incluso si no son las más calificadas “técnicamente”.
Así es como estamos programados para actuar desde una perspectiva biológica.
Una parte interesada confiará en usted como científico de datos si les ha brindado resultados consistentes.
Incluso si a una IA se le ocurre una solución “mejor” a su problema, es probable que la parte interesada le dé prioridad debido a la relación humana intangible que ha construido.
Cada trabajo depende de la conexión humana. Algunas partes estarán automatizadas, pero muchas no.
En el caso de un científico de datos, sería increíblemente difícil de automatizar:
Narración de datos de un problema técnico a una parte interesada específica Recopilar requisitos de un líder empresarial para un problema que desea resolver Comunicar e influir en los miembros de otros equipos y funciones
Cualquier parte humana activa sería imposible de reemplazar.
¿Ha cambiado algo realmente?
Uno de mis antiguos superiores directos me preguntó una vez:
¿Ha cambiado algo realmente desde que se lanzó la IA?
Claro, ahora tenemos mejores herramientas para resolver ciertos problemas y la productividad en ciertos aspectos de nuestros trabajos ha aumentado, pero, honestamente, el rol del científico de datos no ha cambiado mucho.
Tómese un minuto y piense en lo que ha cambiado materialmente en su vida diaria debido a la IA.
Dudo que puedas nombrar mucho, en todo caso.
La IA, en su forma actual, existe desde hace más de 4 años, pero la sociedad en su conjunto no se ha visto significativamente afectada desde mi punto de vista.
Eso es todo lo que hay que decir aquí.
Si, después de leer esto, realmente quieres profundizar en el aprendizaje de la IA, te recomiendo mi publicación anterior, que te brinda una hoja de ruta completa y detallada de todo lo que necesitas para dominar la IA.
¡Puedes comprobarlo a continuación!
¡Otra cosa!
Únase a mi boletín gratuito donde comparto sugerencias, ideas y consejos semanales de mi experiencia como científico de datos e ingeniero de aprendizaje automático en ejercicio. Además, como suscriptor, ¡obtendrás mi plantilla de currículum GRATIS!
Distribuyendo los datos
Correos electrónicos semanales que le ayudarán a conseguir su primer trabajo en ciencia de datos o aprendizaje automáticonewsletter.egorhowell.com