Xiaomi MiMo y TileRT impulsan un modelo de 1 billón de parámetros que supera los 1000 tokens por segundo en GPU comerciales
La velocidad de inferencia se está convirtiendo en una métrica competitiva para modelos de lenguaje grandes. El equipo MiMo de Xiaomi acaba de lanzar MiMo-V2.5-Pro-UltraSpeed, creado en colaboración con el…