especialmente aquellos nuevos en el campo, a menudo piensa que la ciencia de datos se trata solo de recopilar datos de bases de datos, trabajar con algoritmos e implementar modelos.
Sin embargo, es más que eso. El análisis y la visualización de datos son aspectos esenciales de la ciencia de datos, que lo ayudan a comprender los datos complejos, dar sentido a ellos y crear ideas procesables.
Durante mis primeros días en la ciencia de datos, nunca vi la necesidad de visualización de datos, y eso fue porque no estaba expuesto y conocido con el conocimiento y las herramientas apropiadas para abordar las tareas de visualización de manera efectiva.
Todavía recuerdo la frustración de pasar horas enterradas en sábanas de Excel, actualizar manualmente las mesas de pivote y ajustar sin cesar el diseño de la tabla, solo para construir algo que todavía no contaba la historia que quería.
No me malinterpreten, Excel es genial, pero a veces simplemente no lo corta.
Como estudiante de informática con un creciente interés en los datos, sabía que tenía que haber una mejor manera, pero aún no sabía qué era eso.
Mi primera lucha real llegó durante un proyecto universitario donde tuve que analizar los datos de rendimiento de los estudiantes en múltiples semestres.
Sé lo que estás pensando; Eso debería ser bastante fácil.
Bueno, sí, lo es.
Pero para mí en aquel entonces, no lo fue.
Tenía filas sobre filas de puntajes, tasas de asistencia, códigos de cursos, etc., pero convertir todos esos datos en ideas significativas se sintió como tratar de enseñarle a Tony Stark a ser humilde.
Intenté todo: fórmulas de Excel, formato condicional e incluso incursioné un poco con matplotlib para generar algunas gráficas. Nada hizo clic; Fue abrumador.
Fue entonces cuando mencionó un colega principal Microsoft Power BI.
Para aquellos que no saben, Power BI es una visualización de datos y Análisis de negocios Herramienta desarrollada por Microsoft que le permite conectarse, transformar, analizar y, lo más importante, visualizar los datos.
Al principio, sonaba como otra herramienta en una larga lista de software que no había dominado. Así que tuve que hacer una lectura personal.
Tengo mis manos “Power Bi Cookbook: Creación de soluciones de inteligencia empresarial de modelos de datos analíticos, informes y paneles ”, un libro escrito por Brett Powell, y ese fue el comienzo de las cosas más finas.
No es solo un libro, es más como una guía integral para comprender todo el concepto de crear visualizaciones interactivas usando Power BI.
Después de un par de días de aprender el funcionamiento de Power BI, había importado mi conjunto de datos, lo limpié usando Power Query y construí mi primer tablero interactivo.
Para mí, lo vi como algo más que una actualización técnica, fue un cambio de mentalidad que no sabía que necesitaba avanzar en la ciencia de datos. Cambió cómo pensé sobre los datos en sí.
Avanzando hacia este artículo, compartiré formas poderosas en que Power Bi me ayudó en mi Análisis de datos y viaje de visualización, así como historias personales y conclusiones procesables que pueden ayudarlo a crecer en profesionalismo como científico de datos.
El día que dejé de pasar la copia y comencé a vivir
Sí, fue un gran avance.
Cuando comencé a analizar datos, mi flujo de trabajo parecía una carrera de relevos caóticos: abrí un archivo de Excel, copié datos, abrí una nueva ventana, la pegé a otra hoja, cruzé los dedos y rezé a los cielos que nada se rompió.
Y adivina qué, algo siempre se rompe.
Después de copiar y pegar de un archivo a otro, tenía carpetas llenas de archivos llamados cosas como Sales_Q4_FINAL_final2.xlsxy, sin embargo, todavía no podía realizar un seguimiento de todo.
La capacidad de Power Bi para extraer datos de literalmente en todos ladosbases de datos, hojas de cálculo e incluso servicios en la nube, significa que ya no tengo que reproducir tetris de datos. Con solo unos pocos clics, conecté mis hojas de Excel, base de datos SQL, API e incluso archivos de datos que almacené localmente.
No se preocupe si tenía desafíos importar sus conjuntos de datos, o algo no solo funcionó como esperaba. Es fácil, créeme, solo necesitas más práctica.
Juega con el tablero y comprenda qué botón hace qué y cómo usarlos. Existe esta satisfacción que viene con encontrar su camino.
La primera vez que vi toda mi actualización de datos en vivo, me senté y sonreí. No hay pastor de copia, sin caos, solo datos limpios y conectados.
Visualizaciones intuitivas con opciones de personalización
Como dije al principio, la mayoría de las personas subestiman el poder de las buenas imágenes, particularmente cuando se trata de datos. Me parece absurdo porque seamos honestos, los datos sin embargo no siempre cuentan una historia.
Según un estudio publicado en la revista Visualización de informaciónlas personas procesan imágenes 60,000 veces más rápido que el texto.
Si eso no lo hace por usted, incluso el MIT sugiere que el cerebro humano puede identificar imágenes vistas tan poco como 13 milisegundos.
En términos prácticos, estos estudios significan que sus imágenes de tablero se están absorbiendo e interpretando antes de que alguien termine de leer el título de su lista o incluso eche un vistazo a los números que pasó horas crujiendo.
Mi característica favorita de Power Bi tiene que ser el interactivo y avanzado Visualización de datos capacidades. Con su interfaz intuitiva de arrastrar y soltar, puede convertir los datos más aburridos (por mucho que me encantan los datos, se ve aburrido a veces) en paneles dinámicos.
Con una amplia gama de opciones de visualización que van desde:
- Matriz y imágenes de mesa
- Visuales de calibre y KPI
- Cortadores y filtros
- Árbol de descomposición
- Tabla de cascada
- Mape de imágenes
Hay muchos más, pero considero que estos mis favoritos personales.
Los científicos y analistas de datos necesitan la capacidad de interpretar con éxito los datos, identificar tendencias y ayudar a las empresas a tomar mejores decisiones.
Como pionero de la informática, Ben SchneidermanCorrectamente: correctamente:
“La visualización le da respuestas a las preguntas que no sabía que tenía”
Consulta de potencia: el MVP silencioso detrás de mis datos limpios
Podrías preguntar, ¿qué es la consulta de poder?
Consulta de poder es un asistente de transformación de datos integrado en Power Bi. Es una característica maravillosa que le permite limpiar, remodelar y preparar datos antes de cargarlos en su modelo para su análisis y visualización.
Lo veo como el motor que alimenta la preparación de datos en Power BI.
Los datos son desordenados. Eso es solo parte del trabajo. Además, con las empresas y las empresas que se expanden, se recopilan más y más datos. Es bastante desafiante para la mayoría de los científicos y analistas de datos obtener grandes conjuntos de datos sin procesar.
¿Recuerdas el desafío que tuve con mi proyecto universitario?
Resultó que una de las razones por las que me resultaba difícil realizar el análisis era que mis conjuntos de datos eran todos caóticos.
Me pidieron que analizara el rendimiento de los estudiantes, lo que extrajo datos de tres CSV diferentes, cada uno con sus peculiaridades. Uno tenía códigos de admisión en lugar de nombres, otro usó formatos de fecha inconsistentes, y el tercero tenía títulos de curso enumerados en todos los límites (gritándome).
Con Consulta de poderasí es como construí un flujo de trabajo completo:
- Códigos de admisión reemplazados con nombres legibles
- Formatos de fecha convertidos
- Formato de texto estandarizado
- Fusionó todo en una mesa organizada
La preparación de datos toma hasta 80% del tiempo de un analista de datos. Imagine cuánto tiempo ahorraría y cuán productivo se volvería cuando se concentre todo ese tiempo y con la capacidad intelectual en generar mejores ideas. Tiempo recuperado para café y sí, análisis real.
Compartir colaborativo y accesibilidad en la nube
Creo que la colaboración es un jugador clave en la industria de la ciencia de datos, y aquí es por qué: ninguna persona sola generalmente tiene toda la experiencia necesaria para llevar un proyecto de datos sin procesar a un proyecto real del mundo real.
Quédate conmigo.
Considere la ciencia de datos un proceso. Implica recopilar datos, almacenarlos en una base de datos y crear algoritmos y modelos que mejoren la calidad de los datos, el análisis, la visualización y otros elementos esenciales.
Para manejar los datos de manera efectiva, estas etapas a menudo son manejadas por varios profesionales que se especializan en diversas áreas, todos trabajando juntos hacia un objetivo compartido. Por lo tanto, colaboración.
Power BI, siendo una plataforma basada en la nube, le permite publicar y compartir sus informes de análisis con otros profesionales de datos.
En lugar de enviar un correo electrónico a archivos de Excel (que estoy seguro de que todos hicimos una o dos veces), con algunos clics, pude publicar un tablero y compartir un enlace en vivo con mi equipo. Pueden hacer cambios, compartir sus pensamientos o incluso actualizar la fuente de datos en tiempo real.
En un mundo de trabajo remoto/híbrido, tener ese tipo de colaboración perfecta es un verdadero cambio de juego para los científicos de datos.
Controles aplicables
Si alguna vez ha probado el análisis y la visualización de datos, pero le resultó difícil de entender o es difícil de entender, tal vez no haya estado utilizando las herramientas adecuadas.
Power Bi no solo me ayudó a abordar los problemas que encontré cuando comencé a trabajar con datos, transformó cómo abordé los datos por completo.
La mayoría de nosotros ya estamos familiarizados con Power BI, mientras que es una nueva aventura para los demás. Independientemente de la categoría en la que se encuentre, aliento el aprendizaje constante de la herramienta y cómo maximizar sus características.
Recomiendo encarecidamente visitar Chico en un cubo En YouTube, él enseña Power BI a través de sus videos informativos.
Para los alumnos verbales, puede obtener una gran parte de la información de Libro de Brett Powell. Lo mencioné en la introducción, y personalmente, para mí, es sin duda el mejor libro sobre visualización de datos que he leído.
Familiarícese con estas características y comience a mejorar su análisis de trabajo de análisis y visualización de datos.