Y lo que nos ha enseñado la revolución Gen-AI para 2024
Todo artículo de moda conlleva la preocupación de su futura obsolescencia. Las tendencias nos capturan. Nos atraen con su novedad y promesas de pertenencia, frescura y, para el científico de datos, su valor. Nos ponemos los últimos modelos, adoptamos las palabras de moda, perseguimos las experiencias virales, todo en pos de esa sensación de “incorporación”. La capacidad de profesar con orgullo que “soy un científico de datos” y sentirme seguro de que todavía significa algo.
Pero dentro de esta burbuja en expansión se esconde la sombra de la obsolescencia. Susurra dudas: “¿Será esta nueva habilidad el remate de la próxima semana?” “¿Me convertiré, armado con los algoritmos de ayer, en un fósil de una era tecnológica pasada?” El miedo a ser “desvalorizados”, excluidos de las arenas siempre cambiantes de la inteligencia artificial, ejerce una poderosa influencia sobre nuestra búsqueda continua de identidad.
En 2021, escribí un artículo abordando mis pensamientos sobre si la ciencia de datos estaba muerta.
¿Está realmente muerta la ciencia de datos?
Y desde entonces, hemos visto una aceleración de los cambios en este campo. Los científicos de datos ya no son tan geniales como antes. La tendencia es la inteligencia artificial y las palabras de moda son generativa, compuesta y multimodal. Con el auge de la IA generativa, surgen nuevas preocupaciones sobre el futuro de los profesionales de la ciencia de datos. Así que aquí reviso mi artículo y la pregunta que planteó; Si no fue así entonces, ¿está muerta la ciencia de datos ahora?
El aumento de [More Capable] Máquinas
Si a los científicos de datos les preocupaba que se automatizaran hasta su extinción antes de 2022, antes del lanzamiento general de ChatGPT, luego de su lanzamiento las preocupaciones parecen aún más palpables, en parte, porque se sienten más alcanzables. Con Gen-AI, la automatización y las soluciones prediseñadas han avanzado incluso más de lo que predije. Las herramientas se han vuelto más sofisticadas y accesibles, lo que permite que más personas sin grandes conocimientos de ciencia de datos construyan modelos. Y ahora, esos modelos se pueden construir utilizando instrucciones de lenguaje natural, lo que reduce aún más la necesidad de habilidades técnicas de programación.
Sin embargo, estas herramientas aún requieren supervisión y juicio humanos, por lo que, si bien permiten a los ciudadanos científicos de datos, no han eliminado la necesidad de profesionales experimentados. La automatización inteligente se está convirtiendo rápidamente en la próxima tendencia. Los científicos de datos que los adopten, que se conviertan en los arquitectos de estos sistemas inteligentes, que cierren la brecha entre la intuición humana y la eficiencia de las máquinas, no serán los reemplazados, sino los irremplazables.
Para ello, debemos continuar nuestra búsqueda de la integración. Como usuarios individuales, las herramientas de Gen-AI a las que se puede acceder a través de interfaces web bien empaquetadas tienen límites en su capacidad para aportar un valor más amplio a los problemas comerciales que pueden resolver. Aprender a integrar esas herramientas de manera efectiva y eficiente en la estructura de nuestro código con integraciones API servirá como verdaderos diferenciadores en la abarrotada fuerza laboral de ciencia de datos.
El conjunto de herramientas en constante evolución
Pero aprender a integrarse con estas máquinas nuevas y más capaces no es el único engranaje del conjunto de herramientas de ciencia de datos. Tenía razón en que seguirían surgiendo nuevas innovaciones a un ritmo rápido, pero no esperaba que ese ritmo se acelerara con el lanzamiento de Gen-AI. Por lo tanto, ahora más profesionales necesitan aprovechar capacidades como MLOps, diseño rápido e IA compuesta junto con la nube, la automatización y la contenedorización que destaqué en 2021.
Para los científicos de datos de antaño, el aprendizaje no era algo que dejáramos encerrado detrás del fino velo de papel de nuestros títulos. Ha definido nuestro éxito en el mundo aplicado y es una lección a la que debemos seguir prestando atención. La realidad sigue siendo: los científicos de datos más adaptables son aquellos que aprenden e integran constantemente los últimos avances en sus flujos de trabajo.
En el panorama cambiante de la ciencia de datos, una habilidad fundamental para los futuros profesionales sigue siendo una comprensión integral de los desafíos asociados con la implementación de herramientas avanzadas de IA. A medida que estas herramientas mejoran sus capacidades, su complejidad inherente crece a la par. Esta mayor complejidad no sólo se traduce en mayores demandas computacionales sino que a menudo también implica mayores costos asociados. Además, muchas de estas herramientas de vanguardia existen más allá de los límites de los firewalls organizacionales, lo que genera preocupaciones con respecto a la privacidad de los datos, consideraciones éticas y aplicabilidad práctica. Para navegar por este terreno de manera efectiva, los futuros científicos de datos deben comprender a fondo estas limitaciones, lo que les permitirá evaluar el potencial de estas herramientas para abordar problemas del mundo real.
La expectativa de una experiencia de usuario
Pero antes de llegar al futuro, todavía hay un pasado con el que debemos lidiar. Y en ese pasado, la ciencia de datos no siempre se centró en una experiencia de usuario perfecta. Los modelos fueron enterrados en código, serializados y guardados en servidores. Acceder a ellos requirió cierta comprensión de cómo fluyen los datos y qué significan las probabilidades.
Pero el futuro es diferente. Hoy en día, los modelos se entregan directamente a los usuarios. Con Gen-AI, todo lo que se necesita para aprovechar estos modelos es una conexión a Internet y un navegador. Este cambio exige un nuevo tipo de científico de datos: uno que piense más allá de la precisión de sus modelos y considere todo el recorrido del usuario.
Así, en lo que respecta a la experiencia del usuario, las expectativas en torno al impacto y el valor han aumentado. Ya no basta con desarrollar modelos: los científicos de datos deben hacer que esos modelos sean utilizables y accesibles a través de aplicaciones e interfaces bien diseñadas. Una mentalidad centrada en el usuario y centrada en los resultados y no solo en métricas de precisión se ha vuelto esencial. Ahora que más personas pueden aprovechar las herramientas de inteligencia artificial, las masas están cada vez más educadas tanto sobre sus promesas como sobre sus limitaciones. La creación de interfaces que permitan soluciones seguirá siendo esencial y, por lo tanto, los científicos de datos del futuro se beneficiarían al desarrollar habilidades con marcos de interfaz de usuario como Streamlit y RShiny para brindar a sus partes interesadas una mayor sensación de control e intratabilidad. Destacaría que esta experiencia ya no es importante, es una expectativa.
Gritando desde los tejados del comercio
A medida que Gen-AI se ha afianzado, los esfuerzos de alfabetización en datos se han intensificado a medida que las organizaciones se dan cuenta del potencial de esta tendencia. Ahora que todos, desde los directores ejecutivos hasta los empleados de nivel inicial, pueden aprovechar la IA en su trabajo diario, cada vez más personas se están volviendo conscientes de la IA. Pero la conciencia no se traduce necesariamente en comprensión. Los científicos de datos desempeñan un papel clave en la difusión del conocimiento, asesoran a los científicos de datos ciudadanos y sirven como tejido conectivo entre los sistemas técnicos y las necesidades comerciales. Las habilidades interpersonales como la comunicación y la traducción son ahora tan vitales como las competencias técnicas duras.
Y reitero, la ciencia de datos sigue siendo relevante porque no es una mera herramienta en el conjunto de herramientas sino más bien una forma de pensar y abordar los problemas. Los científicos de datos son expertos en comprender cómo el aprendizaje automático y los modelos de inteligencia artificial nos ayudan a manejar la incertidumbre de manera más inteligente en espacios problemáticos. Sin una intuición sobre cómo funcionan estos modelos, la realización de su verdadero potencial será, en el mejor de los casos, limitada y, en el peor, aplicada de manera irresponsable.
¿Para qué deberíamos estar preparados en el futuro?
De cara al futuro, predigo que los generalistas de la ciencia de datos necesitarán seguir especializándose en roles más definidos para seguir el ritmo del crecimiento exponencial de la IA. Por un lado, los ingenieros de AutoML se centrarán únicamente en crear y mantener sistemas automatizados. Por otro lado, los ingenieros de soluciones se concentrarán en integrar modelos en productos y garantizar que resuelvan problemas reales. Los científicos de datos se sentarán en el medio, combinando la profundidad técnica con la comprensión empresarial para liderar iniciativas de análisis impactantes. En general, la supervisión y el juicio humanos seguirán siendo esenciales incluso cuando gran parte del trabajo se vuelva cada vez más automatizado. El futuro científico de datos debe adoptar nuevas innovaciones sin perder nunca de vista el elemento humano.
¿El para llevar a casa? Todavía no creo que los científicos de datos tengan nada de qué preocuparse. En resumen, y para responder a la pregunta… no… la ciencia de datos no está muerta y, de hecho, podría decirse que es aún más importante en este mundo integrado de IA en desarrollo. Y nuestra batalla actual contra la preocupación por la obsolescencia puede, de hecho, contener una verdad más profunda sobre la condición humana. Nos recuerda que nada, por muy moderno que sea, es permanente. Así que no nos definamos por la tendencia más candente, sino por los valores y pasiones que capean las tormentas.
¿Le gusta participar para aprender sobre ciencia de datos, crecimiento profesional, vida o malas decisiones comerciales? Aprende más sobre mí aquí.
Recursos adicionales:
- Resumen de 2023: resumen de la era posterior al ChatGPT y qué esperar para 2024
- 7 tendencias clave en ciencia de datos para 2024-2027
- Predicciones de datos + IA para 2024
- Ciencia de datos 2024: donde chocan los gatos, el café y el código
Revisando la muerte de la ciencia de datos fue publicado originalmente en Hacia la ciencia de datos en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.