OPINIÓN

Y cómo empezar a utilizar Python.

¿Pueden los programas de formación generar más prosperidad económica? Imagen generada con Leonardo AI

Gran parte de la ciencia de datos contemporánea responde a la pregunta «¿Qué está pasando?» En mi empresa, por ejemplo, a menudo intentamos detectar qué tan bien se está desempeñando una empresa y cómo un indicador de desempeño está vinculado a otro a través de correlaciones.

Una pregunta más poderosa que valdría la pena responder sería “¿Por qué sucede esto?” Por ejemplo, si detectamos una correlación significativa entre la presencia de mujeres en la dirección y los ingresos de una empresa, ¿cuál es aquí la causa y cuál el efecto? O, si las personas se someten a un programa de entrenamiento, ¿esto mejorará su rendimiento? ¿O las personas con mejor desempeño querrían someterse a un programa de capacitación y, por lo tanto, solo vemos un efecto debido al sesgo de selección?

Existen varios enfoques para identificar relaciones causales en la ciencia de datos. El emparejamiento por puntuación de propensión (PSM) es uno de los más antiguos y surgió hace unos 40 años. Otros métodos como Modelado de ecuaciones estructurales surgió al mismo tiempo. Enfoques como Variables instrumentales Surgió varias décadas antes. La estadística causal sigue siendo un campo muy activo y se están desarrollando muchos métodos nuevos.

Una ventaja clave del PSM es que permite a los investigadores trabajar con datos del mundo real. En particular,…

Por automata