Together AI lanza RedPajama v2: un conjunto de datos abierto con 30 billones de tokens para entrenar modelos de lenguaje grandes
Los datos de alta calidad son esenciales para el éxito de los LLM abiertos de última generación como los modelos Llama, Mistral, Falcon, MPT y RedPajama. Sin embargo, debido a…