0zequq5gzqxc1nau1.jpeg

Di mis primeros pasos en la modelización matemática hace unos 9 años cuando aún era estudiante. Después de terminar mi licenciatura en matemáticas, que tenía mucha teoría, para los estudios de maestría elegí algunos cursos que involucraban modelos matemáticos y optimización de cuestiones económicas. Mi tema favorito en ese momento eran las series temporales. Fue relativamente relajado obtener una visión general de los diferentes enfoques de modelado. Se habían aplicado métodos probados durante más de una década y no habían cambiado rápidamente.

Condiciones similares existían hasta hace unos años al ingresar al mundo de la ciencia de datos. Las técnicas y modelos fundamentales fueron relativamente rápidos de aprender. En la implementación se resolvieron muchas cosas. desde cero, se codificaron y funcionaron redes propias. Se acogieron y probaron nuevas herramientas y tecnologías.

Hoy el sentimiento es otro. Ahora, cuando uno echa un vistazo a los feeds de X o LinkedIn, casi semanalmente recibe noticias sobre herramientas y desarrollos importantes.

Desde el revuelo sobre los LLM con el lanzamiento de ChatGPT en noviembre de 2022, se ha vuelto extremo. La carrera está entre el código abierto y el código cerrado. Google siguió con Gemini, Meta lanzó LLama y la Universidad de Stanford presentó Alpaca. Las aplicaciones se ponen en funcionamiento utilizando herramientas como Langchain, y está surgiendo toda una gama de herramientas para estandarizar aplicaciones. Los mecanismos de sintonización se mejoran continuamente. Y luego también estuvo el lanzamiento de xgboost 2.

La rueda parece girar a una velocidad cada vez mayor. En los últimos años, esto se debe en gran medida a los avances metodológicos en GenAI y a la caja de herramientas en constante crecimiento en el área MLOps.

Y es importante seguir: ¿Qué está pasando en el mercado? Especialmente cuando trabajas en esta industria como consultor. Nuestros clientes quieren saber: ¿Cuáles son las novedades más interesantes? ¿Cómo podemos utilizarlo de forma rentable?

¡Hoy en día es esencial mantener la pelota en marcha! Aquellos que no lo hagan perderán el contacto muy rápidamente.

¿Es ese el caso?

La última vez que asistí a una gran conferencia, me quedé despierto durante dos noches, sin apenas poder dormir. No fue sólo por el nerviosismo antes de una charla, sino también por la enorme cantidad de información que me arrojaron en tan poco tiempo.

Las conferencias son fantásticas. Me gusta conocer gente nueva, aprender sobre diferentes enfoques e intercambiar ideas y problemas que pueden ser completamente nuevos para mí. Sin embargo, esas noches no pude dormir. El Tendré que comprobar esto más adelante con más profundidad.-La lista parece imposible de abordar. Aparece FOMO (miedo a perderse algo). Se producen pensamientos como “¿No es ya demasiado tarde para subirse al tren de GenAI?“En ese momento, pasé por alto el hecho de que yo también era parte del sesgo. Mi presentación fue sobre un caso de uso que implementamos con un cliente. Dos años de trabajo comprimidos en treinta minutos. ¿Se llevó el público impulsos valiosos y elementos de reflexión como estaba previsto? ¿O la contribución también provocó sutilmente FOMO?

Otro fenómeno que sigue reapareciendo es el síndrome del impostor. [1]. Describe el surgimiento de fuertes dudas sobre las propias capacidades, junto con el miedo a ser expuesto como un “fraude”. Las personas que padecen el síndrome del impostor a menudo sienten que no son capaces o no están calificadas para los puestos o tareas que desempeñan. Esto también puede surgir a través de comparaciones con los demás, lo que lleva a una autopercepción momentánea: “En realidad no puedo hacer nada bueno.«

Por intercambios honestos con personas de mi entorno laboral, sé que esto les surge de vez en cuando a muchos. He hablado con personas a las que les atribuiría un nivel muy alto de experiencia y conocimientos. Casi todos conocían este sentimiento.

La variabilidad de las tecnologías y el rápido progreso en el campo de la IA también pueden desencadenar esto.

¿Cuál es el elemento central de la ciencia de datos? Se trata de un sistema que funcione y que cree valor añadido. Si no es un investigador sino un científico de datos en los negocios, la atención se centra en la aplicación. Un modelo o heurística aprende una lógica que un ser humano no puede aprender con tanto detalle y/o aplicar a tal escala. No tiene por qué ser una solución totalmente automatizada de un extremo a otro.

Se debería comenzar con el desarrollo de un sistema que obras y es aceptado por las partes interesadas. Una vez que se establece la confianza en el sistema, se puede ver qué se puede mejorar aún más.

¿Es la metodología? Quizás se esté utilizando un algoritmo que podría ser reemplazado por una arquitectura de aprendizaje profundo capaz de representar más correlaciones en las variables.

¿Es el tiempo de ejecución? ¿Se puede reducir el tiempo de ejecución mediante otros marcos o con la ayuda de la paralelización? Entonces el camino está despejado para abordar este tema.

Quizás también sea la captura y gestión sistemática de la calidad de los datos. Las herramientas de validación de datos pueden ayudar a detectar desequilibrios de datos de manera temprana, identificar desviaciones y monitorear el resultado de un sistema de aprendizaje automático.

Es válido abordar con cautela las nuevas técnicas paso a paso y mejorar continuamente un sistema existente.

A decir verdad, se necesita tiempo para aprender nuevos métodos y tecnologías. Hay muchas opciones para una descripción general rápida: resúmenes tl;dr, repositorios de descripción general, canales de YouTube, etc. Sin embargo, también olvido rápidamente los temas si no les dedico más tiempo. Por tanto, para familiarizarme con un tema o una tecnología concreta, no me queda más remedio que reservar de vez en cuando una tarde o un sábado para profundizar en ello.

El hecho de que la adquisición de conocimientos personales lleve tiempo también revela directamente la limitación que todos tenemos.

Otro aspecto es que uno no se puede forzar la experiencia. La capacidad de adoptar nuevas tecnologías también aumenta con la cantidad de experiencia que ya se ha adquirido. Lo mismo se aplica a la capacidad de evaluar tecnologías y herramientas. Cuanto mayor es la propia experiencia, más fácil resulta. Pero esto requiere haber desarrollado primero una comprensión más profunda de otras tecnologías, lo que sólo puede lograrse a través de la experiencia práctica.

No tengas miedo de hacer preguntas. Probar cosas a un nivel superior no está mal. Pero a veces también vale la pena buscar activamente experiencias. ¿Quizás ya haya alguien en su empresa o red que ya haya trabajado con la tecnología xy? ¿Por qué no ir a un almuerzo temático conjunto? El requisito previo básico para esto: estar en un entorno donde puedas hacer preguntas (!).

Además, manténgase comprometido. Como se describió anteriormente: la mejor manera de retener las cosas es haciéndolas. Pero esto no significa que no merezca la pena estar atentos sistemáticamente a diestro y siniestro y mantenerse informado sobre noticias que no entran dentro del ámbito de trabajo (actual). Hay muchos boletines informativos excelentes por ahí. Uno muy bueno es El lote Por DeepLearning.AI [2].

Trabajo en un equipo de seis científicos de datos. Las mismas observaciones mencionadas anteriormente se aplican aquí: incluso dentro de este grupo relativamente pequeño, uno puede ser susceptible al síndrome del impostor. Después de todo, siempre hay alguien que tiene más experiencia o al menos ha adquirido algo de experiencia en un tema, metodología o herramienta en particular.

En nuestro equipo, nos reunimos quincenalmente para una Comunidad de Práctica. Establecimos dos políticas:

1. Siempre comenzamos en un nivel alto para asegurarnos de que todos los miembros estén de acuerdo y no asumimos que todos ya están profundamente metidos en el tema. Entonces podremos profundizar más.

2. Se recomienda encarecidamente explorar colectivamente un tema en el que nadie haya desarrollado aún una amplia experiencia.

En la última sesión, abordamos el tema del ajuste de los LLM versus el aprendizaje y las indicaciones en pocas oportunidades. Exploramos y experimentamos juntos con varios métodos de ajuste. Más importante aún, obtuvimos una serie de ideas valiosas sobre cuestiones comerciales, que determinaron qué mecanismos podrían ser más efectivos. Salimos de la reunión con muchas buenas ideas y más tareas de investigación. Esto es mucho más valioso que un conocimiento profundo de cada detalle.