Si yo por un tiempo, probablemente sepas que comencé mi carrera como Ingeniero de control de calidad antes de la transición al mundo de análisis de datos. No fui a la escuela por ello, no tuve un mentor y no aterrizé en un programa de capacitación formal. Todo lo que sé hoy, desde SQL hasta modelado y narración de historias con datos, es autodidacta. Y créanme, ha sido un viaje de prueba, error, aprendizaje y reaudación.
El dilema que cambió mi carrera
Hace unos años, comencé a pensar en cambiar de organizaciones. Al igual que muchas personas en roles tecnológicos de evolución rápida, enfrenté una pregunta sorprendentemente difícil:
¿Qué papel estoy haciendo realmente? ¿Qué roles debo solicitar?
En el papel, yo era un Analista de datos. Pero en realidad, mi rol se extendió a horcajadas sobre varias funciones: escribir tuberías SQL, construir paneles, definir KPI y cavar en análisis de productos. No estaba seguro de si debería solicitar roles de analistas, roles BI o algo completamente diferente.
Para empeorar las cosas, en aquel entonces, los títulos de trabajo eran vagos, y las descripciones de trabajo estaban hinchadas con palabras de moda. Encontrarías una publicación titulada “Analista de datos” que enumeraron requisitos como:
- Construir tuberías ML
- Escribir guiones ETL complejos
- Mantener lagos de datos
- Crear paneles
- Presentes de información a nivel ejecutivo
- Y oh, por cierto, sea excelente en la gestión de los interesados
Fue abrumador y confuso. Y sé que no estoy solo en esto.
Avance rápido hasta hoy: afortunadamente, las cosas están evolucionando. Todavía hay una superposición entre los roles, pero las organizaciones han comenzado a definirlos más claramente. En este artículo, quiero desglosar el Diferencias reales entre los roles de datosa través de la lente de un ejemplo del mundo real.
Un escenario del mundo real: conocer Quikee
Imaginemos una startup ficticia de comercio rápido llamado Quikeelanzando a través de múltiples ciudades indias. Su propuesta de valor? Entregar comestibles y elementos esenciales dentro 10 minutos.
Los clientes realizan pedidos a través de la aplicación o sitio web. Detrás de escena, hay micro guardarropas (también llamados “tiendas oscuras”) en todas las ciudades, y una flota de socios de entrega que hacen esas entregas al rayo.
Ahora, pasemos por las necesidades de datos de esta compañía, desde el momento en que se realiza un pedido, hasta los paneles que los ejecutivos usan en sus reuniones del lunes por la mañana.
Paso 1: Capturar y almacenar datos sin procesar
El momento en que un cliente realiza un pedido, datos transaccionales se genera:
- Marcas de tiempo
- ID de pedido
- Artículos ordenados
- Precio
- Códigos de descuento
- Ubicación del cliente
- Método de pago
- Socio de entrega asignado
Supongamos que quikee usa Amazon Kinesis para transmitir estos datos en tiempo real a un S3 Data Lake. Esa corriente es de alto volumen, sensible al tiempo y es crucial para el seguimiento de negocios.
Pero aquí está la captura: los datos sin procesar son desordenados. No puede usarlo directamente para la toma de decisiones.
Entonces, ¿qué pasa después?
Paso 2: Construyendo tuberías de datos
Ingrese el Ingenieros de datos.
Son responsables de:
- Ingerir datos en tiempo real
- Validación de la consistencia del esquema
- Manejo de fallas y reintentos
- Escribir tuberías para mover datos de S3 a un almacén de datos (por ejemplo, copo de nieve o desplazamiento al rojo)
Aquí es donde ETL (Extraer, transformar, carga) o ELT Las tuberías entran en juego. Los ingenieros de datos limpian, formatan y estructuran los datos para hacer que se consulte.
Por ejemplo, una tabla de pedidos podría dividirse en:
- Órdenes → una fila por pedido
- Order_Items → una fila por artículo en un pedido
- Pagos → una fila por intento de pago
En esta etapa, los registros sin procesar se convierten en tablas estructuradas con las que los analistas pueden trabajar.
Paso 3: Modelado dimensional y OLAP
A medida que el liderazgo comienza a hacer preguntas estratégicas como:
- “¿Qué ciudad aporta más ingresos?”
- “¿Qué tienda tiene un rendimiento inferior?”
- “¿Cuál es nuestro tiempo de entrega promedio por zona?”
… queda claro que la consulta de datos transaccionales directamente no escalará.
Ahí es donde modelado dimensional entra.
En lugar de tablas planas y crudas, los datos se estructuran de hecho y tablas de dimensión.
🔸 Mesas de hecho
- Tablas de datos cuantitativas grandes que contienen claves extrañas junto con medidas y métricas (Bueno, la mayoría de las veces. También hay tablas de datos sin hechos que no tienen ninguna medida.).
- Ejemplos:
fact_orders,fact_payments,fact_deliveries - Contiene métricas como ingresos, recuento de pedidos, tiempo de entrega
🔹 Tablas de dimensión
- Tablas más pequeñas y descriptivas que ayudan a comprender los datos en una tabla de hechos
- Ejemplos:
dim_store,dim_product,dim_customer,dim_delivery_agent - Ayuda a filtrar, agrupar y unir hechos para ideas más profundas
Esta estructura habilita Olap—Coliar consultas analíticas a través de múltiples dimensiones. Por ejemplo, ahora puede ejecutar consultas como:
“Muéstrame tiempo de entrega promedio por tienda y hora del día, en los últimos 7 días”.
Este paso es realizado por ingenieros de datos en la mayoría de las organizaciones, pero construí pocas tablas tenues y hábiles cuando estaba trabajando como Inteligencia de negocios Ingeniero en Amazon.
Paso 4: Definición de KPI y métricas
Aquí es donde Ingenieros de análisis (o ingenieros de BI) brillar.
Se sientan entre la capa técnica de datos y los usuarios de negocios. Sus responsabilidades a menudo incluyen:
- Definición de KPI (por ejemplo, tasa de rotación, repetición de compra %, tiempo de complemento)
- Escribir lógica para métricas complejas (por ejemplo, retención de cohortes, usuarios activos)
- Creación modelos semánticos o capas de métricas En herramientas como DBT o Looker
- Asegurar definiciones consistentes en toda la empresa
Por ejemplo, en Amazon, nuestro equipo no consultó datos sin procesar para calcular los ingresos cada vez. En cambio, creamos tablas de hechos preengregadas en granos diarios, semanales y mensuales. De esa manera, los paneles se cargaron más rápido, y las métricas se mantuvieron consistentes entre los equipos.
Los ingenieros de análisis actúan como traductores entre la ingeniería y el negocio, definir qué Medimos y cómo lo medimos.
Paso 5: Análisis, informes y narración de cuentos
Ahora viene el papel de la Analista de datos.
Armados con datos limpios y modelados, se centran en responder preguntas comerciales reales como:
- “¿Por qué la retención cayó en Bangalore el mes pasado?”
- “¿Qué códigos de cupón impulsan los usuarios más nuevos?”
- “¿Cuáles son los principales productos reordenados en los primeros 30 días?”
Construyen paneles en herramientas como Tableau, Power BI o Looker. Ejecutan consultas SQL ad-hoc. Se sumergen en los resultados de las pruebas A/B, las tendencias de comportamiento del usuario y la efectividad de la campaña.
Pero sobre todo, ellos contar historias Con datos, hacer números complejos comprensibles y procesables para las partes interesadas.
¿Quién es quién?
TL; DR: ¿Dónde encajas?
Así es como lo pienso:
- ¿Te encanta construir tuberías robustas y resolver problemas de escalabilidad? → Eres un Ingeniero de datos
- ¿Te encanta definir las métricas comerciales y organizar conjuntos de datos complejos? → Eres un Ingeniero de análisis
- ¿Me encanta descubrir ideas y contar historias con datos? → Eres un Analista de datos
Por supuesto, los roles del mundo real a menudo los combinan. Especialmente en empresas más pequeñas, puede usar múltiples sombreros. Y eso está bien.
La clave no es el título, pero donde agrega el mayor valor y Lo que te energiza.
Pensamientos finales
Me llevó mucho tiempo entender lo que realmente hago, no solo lo que dice mi título de trabajo. Y si alguna vez has sentido esa confusión, no estás solo.
Hoy, puedo decir claramente que opero en la intersección de modelado de datos, lógica de negociosy narración de cuentos—Un punto óptimo entre análisis e ingeniería. Y he aprendido que la capacidad de conectar los puntos es más importante que encajar en una caja perfecta.
Si has caminado por un camino similar, o usa múltiples sombreros en tu papel, me encantaría escuchar tu historia.
Deja un comentario 👇 o comparte esto con alguien que lo resuelva también.