Sirviendo LLM utilizando instancias vLLM y Amazon EC2 con chips de IA de AWS
El uso de grandes modelos de lenguaje (LLM) y la IA generativa se ha disparado durante el último año. Con el lanzamiento de potentes modelos básicos disponibles públicamente, las herramientas…