Perplexity AI lanza TransferEngine y pplx garden para ejecutar billones de parámetros LLM en clústeres de GPU existentes
¿Cómo pueden los equipos ejecutar billones de modelos de lenguaje de parámetros en clústeres de GPU mixtos existentes sin hardware nuevo costoso o una fuerte dependencia del proveedor? El equipo…