8 cosas que la mayoría de los programas de ciencia de datos no enseñan (pero que debes saber) - Parte 2 | por Dasha Herrmannova, Ph.D.

El MIT llama a esto “el semestre que falta en tu educación en informática”

Lo que tienen en común la ciencia de datos y la ingeniería de software es escribir código. Pero si bien el código es el resultado principal de la ingeniería de software, los proyectos de ciencia de datos suelen terminar con modelos, resultados e informes. En consecuencia, en la ciencia de datos, la calidad, la estructura y la entrega del código suelen ser, en el mejor de los casos, una ocurrencia tardía.

La expectativa implícita en los proyectos de ciencia de datos es que se pueda confiar en los resultados reportados al final.

Esto significa que si alguien le pidiera que volviera a ejecutar su análisis o el de otra persona, podría obtener los mismos resultados. independientemente de cuánto tiempo haya pasado desde que realizó el análisis por primera vez.

De manera similar, si está desarrollando un componente para un producto, la expectativa implícita es que el componente que desarrolló represente el mejor rendimiento posible dado lo que es razonablemente posible dentro de los requisitos del producto.

Estas afirmaciones pueden parecer obvias, pero satisfacer ambas expectativas puede resultar bastante difícil.

Si no me crees, piensa en tus proyectos pasados.

¿Alguna vez ha tenido dificultades para ejecutar su código anterior o para descubrir qué versión de sus datos o qué hiperparámetros utilizó para obtener un resultado específico?

Este es el segundo artículo de una serie en la que hablo sobre habilidades prácticas en ciencia de datos de las que, según mi experiencia, no se habla en los cursos de ciencia de datos, pero que ocuparán gran parte de su día a día como científico de datos. Esta publicación está inspirada en un curso que impartí en la Universidad de Tennessee en Knoxville: DSE 511, y en un fantástico curso del MIT que acertadamente se llama “el semestre que falta de tu educación informática.”

Esta segunda publicación se centra en las habilidades que le ayudarán a hacer que sus resultados sean más confiables y su código más reutilizable.

8 cosas que la mayoría de los programas de ciencia de datos no enseñan (pero que debes saber) – Parte 2 | por Dasha Herrmannova, Ph.D. | marzo de 2024

ByEquipo de 7 minutos

El MIT llama a esto “el semestre que falta en tu educación en informática”

By Equipo de 7 minutos

Related Post

De analista de datos a ingeniero de datos: mi hoja de ruta de autoaprendizaje de 12 meses

Cómo crear inteligencia de código a nivel de repositorio con Repowise mediante análisis de gráficos, detección de códigos inactivos, decisiones y contexto de IA

Deje de evaluar los LLM con “verificaciones de ambiente”

You missed

El medicamento para la diabetes más recetado del mundo ha estado funcionando en el órgano equivocado

Torrevieja avanza con un importante parque verde para transformar el Alto de la Casilla – The Leader

Katrina Kaif publica fotos adorables con su hijo Vihaan en el cumpleaños de Vicky Kaushal

El asteroide 2026 JH2 está a punto de pasar cerca de la Tierra, en términos relativos