Investigadores de la Universidad de Washington y la Universidad de Duke presentan Punica: un sistema de inteligencia artificial para servir múltiples modelos LoRA en un clúster de GPU compartido
Especializarse en modelos de lenguaje grande (LLM) previamente entrenados para tareas de dominios específicos con datos de entrenamiento mínimos, está ganando popularidad, la adaptación de bajo rango o LoRA. Los…