14B - 7 minutos

Microsoft AI presenta Rstar2-agent: un modelo de razonamiento matemático de 14B entrenado con un aprendizaje de refuerzo de agente para lograr un rendimiento de nivel fronterizo

August 30, 2025 Equipo de 7 minutos

El problema con “pensar más” Los modelos de idiomas grandes han hecho avances impresionantes en el razonamiento matemático al extender sus procesos de cadena de pensamiento (cot), esencialmente “pensando más…

Inteligencia artificial

Modelos de razonamiento de código abierto NVIDIA de código abierto (32B, 14B, 7B)

May 8, 2025 Equipo de 7 minutos

Nvidia continúa presionando los límites del desarrollo de IA abierta mediante la orientación abierta de su Abrir suite de modelo de razonamiento de código (OCR) -Un trío de modelos de…

Inteligencia artificial

Microsoft AI lanzó PHI-4-Razoning: un modelo de razonamiento de peso abierto de parámetros de 14B que logra un rendimiento sólido en tareas de razonamiento complejos

May 1, 2025 Equipo de 7 minutos

A pesar de los avances notables en los modelos de idiomas grandes (LLM), el rendimiento efectivo en las tareas intensivas en razonamiento, como la resolución de problemas matemáticos, la planificación…

Microsoft AI presenta Rstar2-agent: un modelo de razonamiento matemático de 14B entrenado con un aprendizaje de refuerzo de agente para lograr un rendimiento de nivel fronterizo

Modelos de razonamiento de código abierto NVIDIA de código abierto (32B, 14B, 7B)

Microsoft AI lanzó PHI-4-Razoning: un modelo de razonamiento de peso abierto de parámetros de 14B que logra un rendimiento sólido en tareas de razonamiento complejos

You missed

Algunos de los últimos neandertales eran sorprendentemente diversos genéticamente

El petróleo cae por debajo de los niveles de antes de la guerra a medida que aumentan los flujos del Golfo

El presidente de México y el rey de España utilizarán la Copa del Mundo para reparar la brecha diplomática

Vídeo: Shah Rukh Khan disfruta de sus éxitos en un evento en Mumbai

Tag: 14B

Microsoft AI presenta Rstar2-agent: un modelo de razonamiento matemático de 14B entrenado con un aprendizaje de refuerzo de agente para lograr un rendimiento de nivel fronterizo

Modelos de razonamiento de código abierto NVIDIA de código abierto (32B, 14B, 7B)

Microsoft AI lanzó PHI-4-Razoning: un modelo de razonamiento de peso abierto de parámetros de 14B que logra un rendimiento sólido en tareas de razonamiento complejos

You missed

Algunos de los últimos neandertales eran sorprendentemente diversos genéticamente

El petróleo cae por debajo de los niveles de antes de la guerra a medida que aumentan los flujos del Golfo

El presidente de México y el rey de España utilizarán la Copa del Mundo para reparar la brecha diplomática

Vídeo: Shah Rukh Khan disfruta de sus éxitos en un evento en Mumbai