¡Reproduzcamos NanoGPT con JAX! (Parte 1) | por Louis Wang | Jul, 2024
Inspirado en el reciente video de YouTube de Andrej Kapathy sobre Reproduzcamos GPT-2 (124M)Me gustaría reconstruirlo con la mayoría de las optimizaciones de entrenamiento en Jax. Jax está diseñado para…