Las habilidades que unen el trabajo técnico y el impacto empresarial

En la serie Author Spotlight, los editores de TDS conversan con miembros de nuestra comunidad sobre su trayectoria profesional en ciencia de datos e inteligencia artificial, sus escritos y sus fuentes de inspiración. Hoy estamos encantados de compartir nuestra conversación con Maria Mouschoutzi.

María es analista de datos y gerente de proyectos con una sólida experiencia en investigación de operaciones, ingeniería mecánica y optimización de la cadena de suministro marítima. Combina experiencia práctica en la industria con análisis basados ​​en investigaciones para desarrollar herramientas de apoyo a la toma de decisiones, optimizar procesos y comunicar conocimientos entre equipos técnicos y no técnicos.

En “Lo que realmente significan ‘pensar’ y ‘razonar’ en la IA y los LLM”, aborda la brecha semántica entre el razonamiento humano y el de la máquina. ¿Cómo afecta la comprensión de esta distinción la forma en que aborda el desarrollo y la interpretación de modelos en su trabajo profesional?

La IA ha generado un gran revuelo últimamente. De repente, muchos productos basados ​​en ML de la vieja escuela pasan instantáneamente a llamarse IA, y parece haber una demanda renovada de cualquier cosa que tenga IA. Debido a esto, creo que ahora es esencial que todos tengan una comprensión técnica básica de qué es la IA y cómo funciona, para que estén en condiciones de evaluar lo que puede y no puede hacer por ellos.

La verdad es que llevamos mucho equipaje sobre la naturaleza misma de la IA, que se origina en narrativas de nuestro legado de ciencia ficción. Este bagaje hace que sea fácil dejarse llevar por todo el potencial emocionante y prometedor de la IA y olvidar sus capacidades actuales reales, juzgándola en última instancia como una especie de solución mágica que aliviará todos nuestros problemas. Los usuarios empresariales sin conocimientos técnicos son los más propensos a este sobreexcitamiento por la IA, imaginándola a veces como una superinteligencia de caja negra, capaz de proporcionar respuestas y soluciones correctas para cualquier cosa.

Para bien o para mal, esto no podría estar más lejos de la verdad. Los LLM, el principal avance científico por el que realmente gira todo el alboroto de la IA, son impresionantemente buenos en ciertas cosas (por ejemplo, generar correos electrónicos o resúmenes), pero no tan buenos en otras cosas (por ejemplo, realizar cálculos complejos o analizar relaciones de causa y efecto multinivel).

Tener una comprensión técnica de qué es la IA y cómo funciona fundamentalmente me ha ayudado enormemente en mi trabajo profesional. Principalmente, me permite descubrir casos de uso válidos de la IA y gestionar las expectativas de los usuarios empresariales sobre lo que se puede y no se puede hacer. A un nivel más técnico, me permite distinguir los componentes específicos que deben usarse en contextos específicos, para que la solución entregada tenga un valor real para el negocio.

Por ejemplo, si se necesita una aplicación RAG para buscar documentación técnica específica y realizar cálculos basados ​​en la información que se encuentra en esa documentación, significa que se debe incluir un componente de terminal de código en la aplicación para realizar los cálculos (en lugar de dejar que el modelo responda directamente).

¿De dónde saca la inspiración inicial para sus artículos, especialmente los más filosóficos como la serie “Water Cooler Small Talk”?

La inspiración inicial para mi serie “Water Cooler Small Talk” provino de conversaciones reales que experimenté en una oficina, así como de historias de amigos. Creo que debido a la tendencia de la gente a evitar conflictos innecesarios en los entornos corporativos, a veces se pueden expresar algunas opiniones realmente escandalosas en discusiones informales alrededor de un dispensador de agua. Y, por lo general, nadie menciona hechos incorrectos sólo para evitar conflictos o desafiar a sus colegas.

Aunque tales conversaciones son benévolas y bien intencionadas (en realidad, simplemente un descanso casual del trabajo), a veces conducen a la perpetuación de hechos científicos incorrectos. Especialmente en el caso de temas complejos y no tan fáciles de entender intuitivamente, como las estadísticas y la inteligencia artificial, podemos simplificar demasiado las cosas y perpetuar opiniones inválidas.

La primera opinión que me impulsó a escribir un artículo completo al respecto fue que “si juegas suficientes rondas de ruleta, eventualmente ganarás, porque las probabilidades son aproximadamente 50/50 y los resultados eventualmente se equilibrarán”. Ahora bien, si alguna vez ha tomado una clase de estadística, sabrá que las cosas no funcionan así; pero si no ha tenido esa clase de estadística y nadie lo menciona, puede terminar esta discusión con algunas ideas extrañas sobre cómo funcionan los juegos de azar. Entonces, mi inspiración inicial para esa serie fueron principalmente temas estadísticos mal entendidos.

Sin embargo, los mismos malentendidos, si no más, se aplican hoy en día a temas relacionados con la IA. El enorme revuelo que ha generado la IA ha hecho que las personas imaginen y difundan todo tipo de información errónea sobre cómo funciona la IA y qué puede hacer, y a veces lo hacen con una confianza increíble. Por eso es tan importante educarnos sobre los fundamentos, sin importar si se trata de estadísticas, inteligencia artificial o cualquier otro tema.

¿Puede explicarnos el proceso típico de redacción de un artículo técnico detallado, desde la investigación inicial hasta el borrador final? ¿Cómo se equilibra la precisión técnica profunda con la accesibilidad para una audiencia general?

Cada publicación técnica comienza con un concepto técnico sobre el que quiero escribir; por ejemplo, demostrar cómo usar una biblioteca específica o cómo estructurar un determinado problema en Python. Por ejemplo, en mi publicación sobre Pokémon, el objetivo era explicar cómo estructurar un problema de investigación de operaciones en Python. Después de identificar este concepto técnico central en el que quiero centrarme, mi siguiente paso suele ser buscar un conjunto de datos apropiado que pueda usarse para demostrarlo.

Creo que esta es la parte más desafiante y que requiere más tiempo: encontrar un buen conjunto de datos de código abierto que pueda usarse libremente para su análisis. Si bien existen muchos conjuntos de datos, no es tan trivial encontrar uno que esté disponible gratuitamente, con datos completos y lo suficientemente interesante como para contar una buena historia.

En mi opinión, el tipo de conjunto de datos que vas a utilizar puede tener un gran impacto en la popularidad de tu publicación. Estructurar un problema de investigación de operaciones usando Pokémon suena mucho más divertido que usar turnos de empleados (¡eww!). En general, el conjunto de datos debería ajustarse temáticamente al tema técnico que he elegido y crear una historia algo coherente.

Una vez identificado el tema técnico de la publicación y el conjunto de datos que voy a utilizar, escribo el código real. Este es un paso bastante sencillo: escriba el código utilizando el conjunto de datos y haga que se ejecute y produzca resultados correctos.

Una vez que terminé el código y me aseguré de que se ejecuta correctamente, empiezo a redactar la publicación real. Por lo general, comienzo mis publicaciones con una breve introducción sobre lo que inicialmente despertó mi interés en este tema específico (por ejemplo, quería hacer una visualización compleja para mi doctorado, y la biblioteca Searoute Python me hizo la vida más fácil) y cómo este tema puede ser útil para el lector (leer mi tutorial que explica las llamadas API a la API de datos de Pokémon puede ayudarlo a comprender cómo escribir llamadas a cualquier API).

También agrego algunas breves explicaciones generales, cuando sea apropiado, de la premisa teórica subyacente del caso de uso que estoy demostrando, así como una breve introducción a las bibliotecas de códigos que usaré.

En la parte principal de la publicación técnica, normalmente muestro cómo estructurar el código con fragmentos de Python y presento explicaciones paso a paso de cómo se desarrolla todo y los resultados que se esperan obtener si todo funciona correctamente.

También me gusta agregar capturas de pantalla GIF que muestran los diagramas interactivos incorporados en el código; creo que hacen que las publicaciones sean mucho más interesantes, fáciles de entender y visualmente atractivas para el lector.

¡Y ahí lo tienes! ¡Un tutorial técnico!

¿Qué lo motivó inicialmente a comenzar a compartir sus conocimientos y perspectivas con la comunidad de ciencia de datos en general y qué aporta el proceso de redacción a su práctica profesional?

En 2017, mientras escribía mi tesis de diploma, me topé con Medium y la publicación Towards Data Science por primera vez. Después de leer un par de publicaciones, recuerdo haber quedado completamente hipnotizado por la abundancia de material técnico, la variedad de temas y la creatividad de las publicaciones. Se sentía como una comunidad de ciencia de datos, con escritores de diversos orígenes y en diferentes niveles técnicos: había artículos para todos los niveles y para varios dominios.

Pero además de apreciar el tecnicismo de los tutoriales que me permitieron aprender y comprender más sobre la ciencia de datos, también me gustó la creatividad y la narración de las publicaciones. A diferencia de una página de GitHub o una respuesta de Stack Overflow, había cierta creatividad y arte en la mayoría de las publicaciones. Realmente disfruté leyendo esas publicaciones: me ayudaron a aprender muchas cosas sobre ciencia de datos y aprendizaje automático y, con el tiempo, desarrollé silenciosamente el deseo de escribir esas publicaciones yo mismo.

Después de pensarlo por un tiempo, redacté y envié a regañadientes mi primera publicación, y así fue como publiqué con TDS por primera vez a principios de 2023. Desde entonces, he escrito varias publicaciones más para TDS, y disfruté cada una de ellas tanto como la primera.

Una cosa que realmente disfruto al escribir artículos técnicos para TDS es compartir cosas que a mí me resultaron difíciles de entender o especialmente interesantes. A veces, temas complejos como la investigación de operaciones, las probabilidades o la inteligencia artificial pueden resultar atemorizantes e intimidantes, lo que desalienta a las personas incluso a comenzar a leer y aprender más sobre ellos; yo mismo soy culpable de esto.

Al crear una versión simplificada, directa e incluso aparentemente divertida de un tema complejo, siento que permito a las personas comenzar a leer y aprender más sobre él con un comienzo amable y no tan formal y ver por sí mismas que, después de todo, no da tanto miedo.

Por otro lado, escribir me ha ayudado mucho a nivel personal y profesional. Mi comunicación escrita ha mejorado mucho. Con el tiempo, me resulta más fácil presentar temas técnicos complejos de una manera que las audiencias empresariales no técnicas puedan comprender. En última instancia, ponerse en condiciones de explicar un tema a otra persona en términos sencillos obliga a comprenderlo completamente y evitar dejar puntos ambiguos.

Mirando hacia atrás en la progresión de su carrera, ¿cuál es una habilidad no técnica en la que desearía haberse centrado antes?

En una carrera de datos, la habilidad no técnica más importante es la comunicación.

Si bien la comunicación es valiosa en cualquier campo, es especialmente crítica en las funciones de datos. Básicamente, es lo que cierra la brecha entre el trabajo técnico complejo y la comprensión empresarial práctica, y ayuda a convertirlo en un profesional de datos completo.

Esto se debe a que, no importa cuán sólidas sean sus habilidades técnicas, si no puede comunicar el valor de sus entregables a los usuarios y a la gerencia del negocio, no lo llevarán muy lejos.

Es importante poder explicar el valor de su trabajo a audiencias no técnicas, hablar su idioma, comprender lo que les importa y comunicar sus hallazgos de una manera que muestre cómo su trabajo los beneficia.

Los datos y las matemáticas, por muy valiosos que sean, a menudo pueden resultar intimidantes o incomprensibles para los usuarios empresariales. Ser capaz de traducir datos en conocimientos empresariales significativos y luego comunicarlos de forma eficaz es, en última instancia, lo que permite que sus proyectos de análisis de datos tengan un impacto real en una empresa.

Para obtener más información sobre el trabajo de María y mantenerse actualizado con sus últimos artículos, puede seguirla en TDS o LinkedIn.