Una implementación de codificación de un flujo de trabajo completo de regresión bayesiana jerárquica en NumPyro utilizando inferencia impulsada por JAX y análisis predictivo posterior

En este tutorial, exploramos la regresión bayesiana jerárquica con NumPyro y recorremos todo el flujo de trabajo de manera estructurada. Comenzamos generando datos sintéticos, luego definimos un modelo probabilístico que captura tanto patrones globales como variaciones a nivel de grupo. A través de cada fragmento, configuramos la inferencia utilizando NUTS, analizamos distribuciones posteriores y realizamos comprobaciones predictivas posteriores para comprender qué tan bien nuestro modelo captura la estructura subyacente. Al abordar el tutorial paso a paso, desarrollamos una comprensión intuitiva de cómo NumPyro permite el modelado bayesiano flexible y escalable. Consulte los códigos completos aquí.

intente: importar numpyro excepto ImportError: !pip install -q “llvmlite>=0.45.1” “numpyro[cpu]”matplotlib pandas importa numpy como np importa pandas como pd importa matplotlib.pyplot como plt importa jax importa jax.numpy como jnp de jax importa aleatoria importa numpyro importa numpyro.distributions como dist de numpyro.infer importa MCMC, NUTS, predictivo de numpyro.diagnostics importa hpdi numpyro.set_host_device_count(1)

Configuramos nuestro entorno instalando NumPyro e importando todas las bibliotecas necesarias. Preparamos JAX, NumPyro y herramientas de trazado para tener todo listo para la inferencia bayesiana. Mientras ejecutamos esta celda, nos aseguramos de que nuestra sesión de Colab esté completamente equipada para el modelado jerárquico. Consulte los códigos completos aquí.

def generar_datos(clave, n_grupos=8, n_por_grupo=40): k1, k2, k3, k4 = aleatorio.split(clave, 4) true_alpha = 1.0 true_beta = 0.6 sigma_alpha_g = 0.8 sigma_beta_g = 0.5 sigma_eps = 0.7 group_ids = np.repeat(np.arange(n_groups), n_per_group) n = n_groups * n_per_group alpha_g = random.normal(k1, (n_groups,)) * sigma_alpha_g beta_g = random.normal(k2, (n_groups,)) * sigma_beta_g x = random.normal(k3, (n,)) * 2.0 eps = aleatorio.normal(k4, (n,)) * sigma_eps a = true_alpha + alpha_g[group_ids]
b = verdadero_beta + beta_g[group_ids]
y = a + b * x + eps df = pd.DataFrame({“y”: np.array(y), “x”: np.array(x), “group”: group_ids}) verdad = dict(true_alpha=true_alpha, true_beta=true_beta, sigma_alpha_group=sigma_alpha_g, sigma_beta_group=sigma_beta_g, sigma_eps=sigma_eps) devuelve df, clave de verdad = aleatorio.PRNGKey(0) df, verdad = generar_datos(clave) x = jnp.array(df[“x”].valores) y = jnp.array(df[“y”].valores) grupos = jnp.array(df[“group”].valores) n_grupos = int(df[“group”].nunique())

Generamos datos jerárquicos sintéticos que imitan la variación a nivel de grupo del mundo real. Convertimos estos datos en matrices compatibles con JAX para que NumPyro pueda procesarlos de manera eficiente. Al hacer esto, sentamos las bases para adaptar un modelo que aprenda tanto de las tendencias globales como de las diferencias grupales. Consulte los códigos completos aquí.

def hierarchical_regression_model(x, group_idx, n_groups, y=Ninguno): mu_alpha = numpyro.sample(“mu_alpha”, dist.Normal(0.0, 5.0)) mu_beta = numpyro.sample(“mu_beta”, dist.Normal(0.0, 5.0)) sigma_alpha = numpyro.sample(“sigma_alpha”, dist.HalfCauchy(2.0)) sigma_beta = numpyro.sample(“sigma_beta”, dist.HalfCauchy(2.0)) con numpyro.plate(“group”, n_groups): alpha_g = numpyro.sample(“alpha_g”, dist.Normal(mu_alpha, sigma_alpha)) beta_g = numpyro.sample(“beta_g”, dist.Normal(mu_beta, sigma_beta)) sigma_obs = numpyro.sample(“sigma_obs”, dist.Exponential(1.0)) alpha = alpha_g[group_idx]
beta = beta_g[group_idx]
media = alfa + beta * x con numpyro.plate(“datos”, x.forma[0]): numpyro.sample(“y”, dist.Normal(media, sigma_obs), obs=y) nueces = NUTS(modelo_de_regresión_jerárquica, target_accept_prob=0.9) mcmc = MCMC(nueces, num_warmup=1000, num_samples=1000, num_chains=1, Progress_bar=True) mcmc.run(random.PRNGKey(1), x=x, group_idx=grupos, n_groups=n_groups, y=y) muestras = mcmc.get_samples()

Definimos nuestro modelo de regresión jerárquica y lanzamos el muestreador MCMC basado en NUTS. Permitimos que NumPyro explore el espacio posterior y aprenda parámetros como intersecciones de grupo y pendientes. A medida que se completa este muestreo, obtenemos ricas distribuciones posteriores que reflejan incertidumbre en todos los niveles. Consulte los códigos completos aquí.

def param_summary(arr): arr = np.asarray(arr) media = arr.mean() lo, hola = hpdi(arr, prob=0.9) return media, float(lo), float(hi) para nombre en [“mu_alpha”, “mu_beta”, “sigma_alpha”, “sigma_beta”, “sigma_obs”]: m, lo, hola = param_summary(muestras[name]) print(f”{nombre}: media={m:.3f}, HPDI=[{lo:.3f}, {hi:.3f}]”) predictivo = Predictivo(modelo_regresión_jerárquica, muestras, sitios_retorno=[“y”]) ppc = predictivo(random.PRNGKey(2), x=x, group_idx=groups, n_groups=n_groups) y_rep = np.asarray(ppc[“y”]) group_to_plot = 0 máscara = df[“group”].valores == grupo_a_trazar x_g = df.loc[mask, “x”].valores y_g = df.loc[mask, “y”].valores y_rep_g = y_rep[:, mask]

orden = np.argsort(x_g) x_sorted = x_g[order]
y_rep_sorted = y_rep_g[:, order]
y_med = np.median(y_rep_sorted, eje=0) y_lo, y_hi = np.percentile(y_rep_sorted, [5, 95]eje=0) plt.figure(figsize=(8, 5)) plt.scatter(x_g, y_g) plt.plot(x_sorted, y_med) plt.fill_between(x_sorted, y_lo, y_hi, alpha=0.3) plt.show()

Analizamos nuestras muestras posteriores calculando resúmenes y realizando comprobaciones predictivas posteriores. Visualizamos qué tan bien el modelo recrea los datos observados para un grupo seleccionado. Este paso nos ayuda a comprender con qué precisión nuestro modelo captura el proceso generativo subyacente. Consulte los códigos completos aquí.

alpha_g = np.asarray(muestras[“alpha_g”]).media(eje=0) beta_g = np.asarray(muestras[“beta_g”]).mean(axis=0) fig, ejes = plt.subplots(1, 2, figsize=(12, 4)) ejes[0].bar(range(n_groups), alpha_g) ejes[0].axhline(verdad[“true_alpha”]estilo de línea=”–“) ejes[1].bar(rango(n_grupos), beta_g) ejes[1].axhline(verdad[“true_beta”]estilo de línea=”–“) plt.tight_layout() plt.show()

Trazamos las intersecciones y pendientes estimadas a nivel de grupo para comparar sus patrones aprendidos con los valores verdaderos. Exploramos cómo se comporta cada grupo y cómo se adapta el modelo a sus diferencias. Esta visualización final reúne la imagen completa de la inferencia jerárquica.

En conclusión, implementamos cómo NumPyro nos permite modelar relaciones jerárquicas con claridad, eficiencia y un fuerte poder expresivo. Observamos cómo los resultados posteriores revelan efectos globales y específicos de grupo significativos, y cómo las comprobaciones predictivas validan el ajuste del modelo a los datos generados. A medida que juntamos todo, ganamos confianza en la construcción, ajuste e interpretación de modelos jerárquicos utilizando la inferencia basada en JAX. Este proceso fortalece nuestra capacidad de aplicar el pensamiento bayesiano a conjuntos de datos más ricos y realistas donde la estructura multinivel es esencial.

Consulte los códigos completos aquí. No dude en consultar nuestra página de GitHub para tutoriales, códigos y cuadernos. Además, no dude en seguirnos en Twitter y no olvide unirse a nuestro SubReddit de más de 100.000 ML y suscribirse a nuestro boletín. ¡Esperar! estas en telegrama? Ahora también puedes unirte a nosotros en Telegram.

Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como emprendedor e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.

🙌 Siga MARKTECHPOST: agréguenos como fuente preferida en Google.

Una implementación de codificación de un flujo de trabajo completo de regresión bayesiana jerárquica en NumPyro utilizando inferencia impulsada por JAX y análisis predictivo posterior

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Creación de NQS basado en transformadores para sistemas de giro frustrados con NetKet

Una implementación de codificación para construir sistemas de inteligencia artificial de múltiples agentes con SmolAgents mediante ejecución de código, llamada de herramientas y orquestación dinámica

UCSD y Together AI Research presentan Parcae: una arquitectura estable para modelos de lenguaje en bucle que logra la calidad de un transformador dos veces más grande

You missed

S&P 500 y Nasdaq alcanzan máximos históricos en medio de la guerra con Irán

Ladrones armados toman 25 rehenes en un banco de Nápoles y luego desaparecen bajo tierra « Euro Weekly News

Actualizaciones sobre cuándo sale la secuela – Hollywood Life

La ex cirujana general adjunta Erica Schwartz nominada como nueva jefa de los CDC