Código R para extraer datos de conjuntos de datos únicos y combinarlos en un conjunto de datos armonizado listo para un análisis perfecto
Mi investigación académica incluye abrumadoramente identificar conjuntos de datos para la investigación en salud, armonizarlos y combinar (agrupar) los conjuntos de datos individuales para analizarlos juntos. Esto significa combinar conjuntos de datos de poblaciones, sitios de estudio o países. También significa combinar variables para que puedan analizarse juntas de manera efectiva. En otras palabras, trabajo en el campo de la agrupación de datos, donde trabajo a tiempo completo desde 2017.
Describiré la metodología que sigo para extraer datos de conjuntos de datos individuales y combinar los conjuntos de datos individuales en un conjunto de datos agrupado listo para el análisis. Esto se basa en más de siete años de experiencia trabajando en entornos académicos a nivel mundial. Esta historia incluye código en R.
Agrupación de datos: ¿qué es?
En la mayoría de los entornos, recopilaremos datos nuevos (recopilación de datos primarios) o trabajaremos con un solo conjunto de datos que ya está disponible para su análisis. Este conjunto de datos puede ser de un hospital, una población específica (por ejemplo, un estudio epidemiológico realizado en una comunidad) o una encuesta de salud realizada en todo un país (es decir, una encuesta de salud representativa a nivel nacional…