Formación LLM, desde Cero, en Rust | de Stefano Bosisio

Formación LLM, desde Cero, en Rust | de Stefano Bosisio | diciembre de 2024

En este artículo complementario, mostraré mi implementación para entrenar desde cero un modelo similar a GPT, en Rust. Sin GPU, sólo CPU, con un rendimiento 30 veces mejor que el código C nativo.

Imagen por GoogleDeepMind en desempaquetar

en mi ultimo artículopresenté el problema de la multiplicación de matrices, cómo el algoritmo de atención utiliza la multiplicación de matrices para realizar un proceso de promediado y cómo implementar eficientemente, o al menos, para mí, una función de multiplicación de matrices en Rust con Blas.

En este nuevo artículo, quiero mostrar mi primer componente básico para implementar llm.c en Rust, es decir, entrenar un modelo similar a GPT desde cero usando Rust. Esta ha sido mi forma de aprender cada vez más sobre el ecosistema de Rust y comprender cuán comparable es con C. En particular, Quiero que mi código pueda entrenar un modelo similar a GPT, a partir de pesos GPT, usando solo CPU– Entonces no hay GPU ni TPU. Mi objetivo es comprender hasta qué punto podemos impulsar estos modelos en portátiles simples y hasta qué punto se puede utilizar el ecosistema Rust para ello. Con el tiempo, este código también puede ser útil para ajustar los modelos GPT con un corpus de entrada determinado..

Se pueden encontrar todas las piezas de código relevantes. aquí.

Formación LLM, desde Cero, en Rust | de Stefano Bosisio | diciembre de 2024

ByEquipo de 7 minutos

En este artículo complementario, mostraré mi implementación para entrenar desde cero un modelo similar a GPT, en Rust. Sin GPU, sólo CPU, con un rendimiento 30 veces mejor que el código C nativo.

By Equipo de 7 minutos

Related Post

Una mejor manera de modelar el comportamiento de las aleaciones metálicas | Noticias del MIT

Intenté programar mi canalización ETL. Esto es lo que no esperaba.

Liquid AI presenta LFM2.5-Embedding-350M y LFM2.5-ColBERT-350M: modelos densos bicodificadores y de interacción tardía para búsquedas multilingües rápidas en 11 idiomas

You missed

el patio de recreo del superyate

Se vuelve viral y los dentistas están preocupados

Una mejor manera de modelar el comportamiento de las aleaciones metálicas | Noticias del MIT

Los científicos descorchan la química oculta dentro de las botellas de vino