01dcecf Riy2vhe0g.jpeg

No estoy simplemente marcando números en una computadora todo el día

Foto por Myriam Jessier en desempaquetar

Elegir una carrera universitaria fue difícil para mí. Lo sentí como el primer paso para comprometerme con una carrera y quería un poco de todo. Me gustaban las matemáticas y la programación, pero también quería un trabajo que me permitiera ser creativo, me diera una plataforma de comunicación y fuera lo suficientemente versátil como para explorar diferentes industrias. Después de algunas investigaciones, el programa de ciencia de datos del Halıcıoğlu Data Science Institute (HDSI) de UC San Diego parecía una buena opción. A pesar de mi decisión de seguir este camino, todavía tenía dudas y las suposiciones que hice al principio reflejaban este escepticismo. Sin embargo, mientras trabajo en mis últimos trimestres, me alegro (¡y me sorprende!) de cómo las realidades de mi experiencia han divergido de esas expectativas.

Expectativa n.° 1: La ciencia de datos consistirá en muchas clases repetitivas de matemáticas y programación.
La realidad: si bien las matemáticas y la programación son pilares, en realidad hay mucha variedad en las clases.

Mirando hacia atrás, mis clases han tenido mucha más variedad de la que esperaba. Las clases de programación y matemáticas son la mayoría, pero cada curso ofrece una perspectiva diferente sobre temas centrales y al mismo tiempo nos equipa con una gran variedad de herramientas. También hay una diversidad significativamente mayor en el campo, que va desde clases sobre definiciones de equidad estadística hasta bioinformática. También encontré nichos que disfruté especialmente en atención médica, ética de datos y privacidad. Esto me ayudó a ampliar mis perspectivas sobre los roles y las industrias en las que podría ingresar como científico de datos desde el principio.

Expectativa n.° 2: trabajaría solo la mayor parte del tiempo.
La Realidad: Trabajo mucho con otros y soy mejor por eso.

Me gusta trabajar con gente. Las ideas se generan más rápido. ¡Me siento más creativo y es más divertido! Sin embargo, inicialmente cedí al estereotipo y me imaginé haciendo mi tarea de ciencia de datos inclinado sobre una computadora portátil durante la mayor parte del día, por lo que me sorprendió la cantidad de trabajo en grupo que había. Casi todas mis clases de programación y matemáticas nos alientan a trabajar con al menos otra persona. Conocer y trabajar con personas que no conocía me sacó de mi zona de confort y perfeccionó mis habilidades de comunicación y trabajo en equipo. Incluso en entornos profesionales, cuando mi trabajo era independiente, descubrí que trabajar con otros pasantes me convertía en un mejor científico de datos. Aunque cada uno de nosotros tenía habilidades fundamentales similares, apoyarnos unos en otros para utilizar nuestras diferentes fortalezas y áreas de enfoque nos permitió ser mejores en general.

Expectativa n.° 3: la ciencia de datos es lo mismo que el aprendizaje automático.
La realidad: el aprendizaje automático es solo una parte del ciclo de vida del proyecto de ciencia de datos.

Para ser justos, no sabía mucho sobre ciencia de datos o cómo se definía el aprendizaje automático (ML) cuando comencé mi viaje. Aún así, al ingresar al programa HDSI, pensé que la ciencia de datos era sinónimo de ML. Imaginé que la mayor parte de mis clases y trabajo consistirían en crear modelos predictivos y profundizar en redes neuronales. En cambio, la mayor parte de los cursos y trabajos en ciencia de datos se centran en la limpieza, caducidad y visualización de datos, y el análisis de ML toma menos tiempo del esperado al final… al menos por ahora.‍

Expectativa n.° 4: Mi función podría automatizarse.
La realidad: ciertas responsabilidades se pueden automatizar, pero la creatividad de los científicos de datos como solucionadores de problemas no.

Esta preocupación surgió durante mi primera clase de procesamiento del lenguaje natural, donde mi profesor mostró la rapidez con la que GPT-3 podía escribir código. Era desalentador como científico de datos principiante: ¿cómo se suponía que iba a competir con modelos que podían escribir correctamente consultas SQL más rápido de lo que yo podía leerlas? Sin embargo, este ejercicio pretendía ilustrar que nuestro papel como tecnólogos no era simplemente aprender a utilizar herramientas y comprender los procesos inherentes que les permiten funcionar. Los grandes modelos de lenguaje todavía no pueden hacer su tarea correctamente, pero eventualmente (e inevitablemente) mejorarán, y cuando lo hagan, soy optimista de que serán más una ayuda que un perjuicio para los científicos de datos. A diferencia de los científicos de datos, los LLM no solucionan problemas. No pueden generar ideas originales, utilizar la creatividad para resolver problemas ambiguos o comunicarse eficazmente con diferentes audiencias. Esto puede cambiar en el futuro, pero a través de mi educación y experiencias profesionales, estoy seguro de que aún puedo generar un impacto positivo en este campo.

La comida para llevar

Como parte de mi viaje hacia la ciencia de datos, aprendí a aceptar lo inesperado que viene con la realidad. Aprendí que la amplitud y profundidad de la ciencia de datos eran ideales para hacer un poco de todo: investigar, programar, analizar y contar historias. Con eso, confío en mi decisión de dedicarme a la ciencia de datos y estoy emocionado de ver lo que me depara la siguiente fase de mi carrera.