Comprender la calidad de los datos y por qué los equipos luchan con ella |  de Elliott Stam |  marzo de 2024

Calidad de los datos: el término general para la lógica empresarial, la confiabilidad, la validez y la coherencia

El elefante en el cuarto. (Foto por Alberico Iusso en desempaquetar)

Las conversaciones sobre la calidad de los datos pueden resultar difíciles, especialmente cuando el elefante en la sala es un producto de bajo rendimiento.

Las situaciones en las que se desarrollan estas discusiones suelen incluir partes interesadas decepcionadas, gerentes de producto frustrados e ingenieros incomprendidos.

Es posible que frases familiares reboten en las paredes, entre ellas:

  • “arreglar los datos”
  • “discrepancia”
  • “validación de datos”
  • “confianza”
  • “calidad de datos”

Pero hay una fuerza que impide que los individuos lleguen a un entendimiento común. Se pronuncian palabras, pero por alguna razón no llegan. Al leer entre líneas lo que dice cada persona, queda claro que están en juego múltiples definiciones de “calidad de datos”.

El significado y las implicaciones detrás de las palabras son diferentes para cada persona. La validez de la experiencia y perspectiva colectiva del equipo se ve socavada a medida que continúan hablando entre sí. El tiempo sigue corriendo y finalmente abandonan la conversación sin una resolución clara.

Ese es un gran problema y es un tema común en los productos de datos.

La frase “calidad de los datos” se utiliza ampliamente y puede significar diferentes cosas para distintas personas. Comencemos con una definición subjetiva de este término desde la perspectiva de los tres arquetipos presentados anteriormente: partes interesadas, gerentes de producto e ingenieros.

Partes interesadas: supongamos que se trata de personas menos técnicas que interactúan con productos de datos (como paneles) en sus operaciones diarias. Para ellos, una buena calidad de los datos significa que la información refleja con precisión los procesos del mundo real con los que interactúan. Cuando ven un panel, lo primero que piensan es descargar/exportar los datos a una hoja de cálculo para poder conciliar los números con otras cantidades conocidas en las que confían.

Gerentes de producto: La principal preocupación aquí es que los números en product x une los números en product y y contar una historia coherente. Si los números coinciden…