Un conjunto de técnicas y principios genéricos para diseñar un modelo de datos sólido, rentable y escalable para su pila de datos posmoderna.
En los últimos años, a medida que Modern Data Stack (MDS) introdujo nuevos patrones y estándares para mover, transformar e interactuar con los datos, el modelado de datos dimensionales se convirtió gradualmente en una reliquia del pasado. En su lugar, los equipos de datos dependían de One-Big-Tables (OBT) y del apilamiento capa tras capa de modelos dbt para abordar nuevos casos de uso. Sin embargo, estos enfoques llevaron a situaciones desafortunadas en las que los equipos de datos se convirtieron en un centro de costos con procesos no escalables. Por lo tanto, a medida que ingresamos en una era de pila de datos “posmoderna”, definida por la búsqueda de reducir costos, ordenar las plataformas de datos y limitar la proliferación de modelos, el modelado de datos está presenciando una resurrección.
Esta transición coloca a los equipos de datos frente a un dilema: ¿debemos volver a enfoques de modelado de datos estrictos que se definieron hace décadas para un ecosistema de datos completamente diferente, o podemos introducir nuevos principios definidos en función de la tecnología y los problemas comerciales actuales?
Creo que, para la mayoría de las empresas, la respuesta correcta se encuentra en algún punto intermedio. En este artículo, analizaré un conjunto de estándares de modelado de datos para alejarse de…