H100 - 7 minutos

Cohere lanza Command A+: un modelo MoE disperso de 218 B para flujos de trabajo agentes que se ejecuta en tan solo dos GPU H100

May 23, 2026 Equipo de 7 minutos

Cohere acaba de lanzar Command A+, como un modelo de código abierto dirigido a flujos de trabajo agentes empresariales. Disponible bajo una licencia de Apache 2.0, Command A+ es un…

Inteligencia artificial

QeRL: El aprendizaje por refuerzo (RL) cuantificado mediante NVFP4 lleva la formación de 32.000 millones de LLM a un único H100, al tiempo que mejora la exploración

October 16, 2025 Equipo de 7 minutos

¿Qué construiría si pudiera ejecutar el aprendizaje por refuerzo (RL) después del entrenamiento en un LLM de 32 B en NVFP4 de 4 bits (en un solo H100) con una…

Inteligencia artificial

FlashSigmoid: una implementación de atención sigmoidea que reconoce el hardware y hace un uso eficiente de la memoria y que produce un aumento de la velocidad del núcleo de inferencia del 17 % en comparación con FlashAttention-2 en GPU H100

September 14, 2024 Equipo de 7 minutos

Los modelos de lenguaje grandes (LLM) han ganado una importancia significativa en el aprendizaje automático moderno, en gran medida debido al mecanismo de atención. Este mecanismo emplea un mapeo de…

Cohere lanza Command A+: un modelo MoE disperso de 218 B para flujos de trabajo agentes que se ejecuta en tan solo dos GPU H100

QeRL: El aprendizaje por refuerzo (RL) cuantificado mediante NVFP4 lleva la formación de 32.000 millones de LLM a un único H100, al tiempo que mejora la exploración

FlashSigmoid: una implementación de atención sigmoidea que reconoce el hardware y hace un uso eficiente de la memoria y que produce un aumento de la velocidad del núcleo de inferencia del 17 % en comparación con FlashAttention-2 en GPU H100

You missed

Una oreja humana de tamaño natural, impresa en un frasco de gel en dos minutos

El espejo inteligente que necesita conocer – Hollywood Life

SpaceX lanza Starship V3, el cohete más alto y poderoso jamás creado

La demanda por difamación presentada por la novia del director del FBI Kash Patel por acusaciones de que era espía israelí puede seguir adelante

Tag: H100

Cohere lanza Command A+: un modelo MoE disperso de 218 B para flujos de trabajo agentes que se ejecuta en tan solo dos GPU H100

QeRL: El aprendizaje por refuerzo (RL) cuantificado mediante NVFP4 lleva la formación de 32.000 millones de LLM a un único H100, al tiempo que mejora la exploración

FlashSigmoid: una implementación de atención sigmoidea que reconoce el hardware y hace un uso eficiente de la memoria y que produce un aumento de la velocidad del núcleo de inferencia del 17 % en comparación con FlashAttention-2 en GPU H100

You missed

Una oreja humana de tamaño natural, impresa en un frasco de gel en dos minutos

El espejo inteligente que necesita conocer – Hollywood Life

SpaceX lanza Starship V3, el cohete más alto y poderoso jamás creado

La demanda por difamación presentada por la novia del director del FBI Kash Patel por acusaciones de que era espía israelí puede seguir adelante