mi coinstructor y yo nos presentamos al Visualización de datos Curso que enseñamos en la Universidad de Washington con una bolsa de rocas. La bolsa consistía en una colección bastante diversa que yo mismo reuní en un conjunto de caminatas en varias regiones de California.
Nuestros estudiantes están bastante acostumbrados a las actividades sorprendentes y prácticas que les pedimos que participen en la mayoría de las clases, pero esto parecía un poco ahí fuera, incluso para nosotros.
En este artículo, me centraré en los siguientes dos puntos, que colectivamente hablan sobre la importancia de la integración específica del dominio en la ciencia de datos Educación:
- Una descripción de la tarea real que hicimos que los estudiantes hicieron con estas rocas.
- Una profunda inmersión en la discusión que siguió, que se centró en gran medida en el punto de hacer que hagan esto y sus conexiones más profundas con la ciencia de datos.
¿Qué hacer con un montón de rocas?
Una vez que los estudiantes se sentaron en sus respectivos grupos, les pedimos que hicieran lo siguiente:
- Elija dos rocas por grupo.
- Intente identificar formalmente las rocas sin la ayuda de ninguna aplicación de Internet o móvil. En este punto, la mayoría de los estudiantes llegaron a determinar si una roca parecía ser ígnea, sedimentaria o metamórfica.
- Refina sus suposiciones iniciales ahora aprovechando sus recursos electrónicos. Los estudiantes ahora obtuvieron mucho más específicos, identificando a Scoria, Slate, Red Jasper, Gneiss y una gran cantidad de otras rocas en la colección.
- Diseñe e implementen un gráfico (usando software o en papel) que comparó las cualidades de sus rocas o que mostrara información atractiva sobre uno de ellos. Se les animó a buscar datos de apoyo en línea, como dureza, composición mineral, usos potenciales, etc.
Una vez terminado, nos presentaron sus visualizaciones, y procedimos con una discusión en clase.
¿Qué tienen que ver las rocas con la ciencia de datos?
Bastante, como sucede.
Cuando damos la vuelta a la habitación, los estudiantes compartieron una gran cantidad de ideas sobre sus diversas rocas. En muchos casos, la discusión se centró en la utilidad de un enfoque visual particular que los estudiantes habían tomado.
Por ejemplo, un grupo eligió comparar sus dos rocas a través de una tabla de datos que incluía varios puntos de información relevante. Esto llevó a una discusión sobre cómo las tablas de datos son De hecho, un tipo de visualización de datos, especialmente útil en dos situaciones:
- Cuando tiene una cantidad limitada de datos
- Cuando es importante que el usuario pueda elegir datos precisos para sus propósitos
Otras conversaciones giraron en torno a la efectividad del área como una codificación, las particularidades de las escalas de color, etc. Todas las discusiones estándar para un curso de visualización de datos.
Una vez que terminamos esta conversación inicial, planteé una pregunta más complicada para la clase:
“Hasta ahora, hemos hablado sobre los elementos visuales estándar de un gráfico. Podríamos haber discutido estos con cualquier tipo de datos. Entonces, ¿por qué tomar la molestia de traer una bolsa gigante de rocas a la clase y pedirle que los identifique?”
La clase miró fijamente. El momento arrastrado. Entonces, un estudiante levantó la mano vacilante.
“Um … ¿para que podamos sentirnos cómodos trabajando con dominios desconocidos o algo así?”
¡Precisamente! Habíamos mencionado este punto con moderación a los estudiantes antes, pero esta actividad realmente lleva el punto a casa. Como diseñadores e ingenieros eventuales que trabajan en la visualización de datos, y, en general, en la ciencia de los datos, es esencial que estos estudiantes sepan cómo trabajar con dominios con los que pueden no estar familiarizados.
Lo mismo ocurre para ti si estás leyendo este artículo. Como experto en datos en un equipo, rara vez será el experto en dominio, y debe ajustarse a los datos que se le dan. A veces bastante rápido.
En un artículo anterior, “Los tres bloques de construcción de la ciencia de datos” Me sumergí en este punto con mayor detalle. Los dos primeros bloques de construcción, estadísticas e informática, son increíblemente importantes. Dicho esto, el real datos proviene del dominio. Sin el dominio, no habría necesidad de ciencia de datos.
Como científico de datos, si bien tendrá el apoyo de un experto en dominio, aún necesitará diseñar soluciones y escribir código correspondiente a datos con los que pueda estar profundamente familiarizado. Como tal, es increíblemente importante obtener exposición a esta realidad como parte de la educación de ciencia de datos.
Mi coinstructor y yo enseñamos en un departamento de diseño e ingeniería, con estudiantes en gran medida interesados en buscar campos como la investigación de UI/UX Investigación e Ingeniería de Datos. Elegimos hacer que trabajen con rocas precisamente porque sabíamos que era poco probable que supieran demasiado sobre ellas (al menos al nivel de detalle necesario) de antemano.
Y esa falta de conocimiento previo marcó la diferencia.
Pensamientos finales
Si está leyendo esto, supongo que está entrenando para ser un científico de datos o está interesado en hacerlo. Quizás ya eres uno y solo estás completando tu conocimiento.
Cualquiera que sea su posición, mi punto sigue siendo el mismo: Cada vez que tenga, exponerse a nuevos datos. Por su propia naturaleza, literalmente cada campo, cada disciplina, cada tema conocido por el hombre tiene algún tipo de datos y un grupo asociado de personas interesadas en obtener información al respecto.
Y la persona a la que recurren para obtener ayuda podría ser tú.