eficiente - 7 minutos

Cómo construir transformadores con memoria eficiente con xFormers usando secuencias empaquetadas, GQA, ALiBi, SwiGLU y atención causal

June 17, 2026 Equipo de 7 minutos

print(“\n” + “=”*70 + “\n4. Lote empaquetado de longitud variable, sin desperdicio de relleno\n” + “=”*70) seqlens = total = suma(seqlens) H, K = 8, 64 q = torch.randn(1, total,…

Inteligencia artificial

Una guía de codificación de extremo a extremo para NVIDIA KVPress para inferencia LLM de contexto largo, compresión de caché KV y generación de memoria eficiente

April 10, 2026 Equipo de 7 minutos

En este tutorial, adoptamos un enfoque práctico y detallado para explorar KVPress de NVIDIA y comprender cómo puede hacer que la inferencia de modelos de lenguaje de contexto largo sea…

Inteligencia artificial

NVIDIA AI presenta PivotRL: un nuevo marco de IA que logra una alta precisión agente con 4 veces menos turnos de implementación de manera eficiente

March 25, 2026 Equipo de 7 minutos

Los modelos de lenguaje grande (LLM, por sus siglas en inglés) posteriores al entrenamiento para tareas agentes de largo plazo, como ingeniería de software, navegación web y uso de herramientas…

Inteligencia artificial

Cómo construir un canal de ajuste fino de QLoRA estable y eficiente utilizando Unsloth para modelos de lenguaje grandes

March 4, 2026 Equipo de 7 minutos

En este tutorial, demostramos cómo ajustar de manera eficiente un modelo de lenguaje grande usando Unsloth y QLoRA. Nos centramos en crear un canal de ajuste estable y supervisado de…

Inteligencia artificial

Los investigadores de NVIDIA presentan el canal de codificación de transformación KVTC para comprimir las cachés de valores clave 20 veces para un servicio LLM eficiente

February 11, 2026 Equipo de 7 minutos

Servir modelos de lenguajes grandes (LLM) a escala es un desafío de ingeniería enorme debido a la administración de caché de valores clave (KV). A medida que los modelos crecen…

Inteligencia artificial

Rendimiento de Pydantic: 4 consejos sobre cómo validar grandes cantidades de datos de manera eficiente

February 6, 2026 Equipo de 7 minutos

son tan fáciles de usar que también es fácil usarlos de manera incorrecta, como sostener un martillo por la cabeza. Lo mismo ocurre con Pydantic, una biblioteca de validación de…

Inteligencia artificial

NVIDIA AI lleva Nemotron-3-Nano-30B a NVFP4 con destilación consciente de la cuantificación (QAD) para una inferencia de razonamiento eficiente

February 2, 2026 Equipo de 7 minutos

NVIDIA ha lanzado Nemotron-Nano-3-30B-A3B-NVFP4, un punto de control de producción que ejecuta un modelo de razonamiento de parámetros 30B en formato NVFP4 de 4 bits manteniendo una precisión cercana a…

Inteligencia artificial

Zhipu AI lanza GLM-4.7-Flash: un modelo MoE 30B-A3B para agentes y codificación local eficiente

January 21, 2026 Equipo de 7 minutos

GLM-4.7-Flash es un nuevo miembro de la familia GLM 4.7 y está dirigido a desarrolladores que desean un rendimiento sólido de codificación y razonamiento en un modelo que sea práctico…

Inteligencia artificial

Anuncio de la vista previa de Gemma 3n: IA potente, eficiente y centrada en los dispositivos móviles

December 12, 2025 Equipo de 7 minutos

Tras los emocionantes lanzamientos de Gemma 3 y Gemma 3 QAT, nuestra familia de modelos abiertos de última generación capaces de ejecutarse en una única nube o acelerador de escritorio,…

Inteligencia artificial

Jina AI lanza Jina-VLM: un modelo de lenguaje de visión multilingüe de 2.400 millones centrado en el control de calidad visual eficiente con tokens

December 9, 2025 Equipo de 7 minutos

Jina AI ha lanzado Jina-VLM, un modelo de lenguaje de visión de parámetros de 2.400 millones que apunta a la respuesta visual a preguntas multilingües y la comprensión de documentos…

Cómo construir transformadores con memoria eficiente con xFormers usando secuencias empaquetadas, GQA, ALiBi, SwiGLU y atención causal

Una guía de codificación de extremo a extremo para NVIDIA KVPress para inferencia LLM de contexto largo, compresión de caché KV y generación de memoria eficiente

NVIDIA AI presenta PivotRL: un nuevo marco de IA que logra una alta precisión agente con 4 veces menos turnos de implementación de manera eficiente

Cómo construir un canal de ajuste fino de QLoRA estable y eficiente utilizando Unsloth para modelos de lenguaje grandes

Los investigadores de NVIDIA presentan el canal de codificación de transformación KVTC para comprimir las cachés de valores clave 20 veces para un servicio LLM eficiente

Rendimiento de Pydantic: 4 consejos sobre cómo validar grandes cantidades de datos de manera eficiente

NVIDIA AI lleva Nemotron-3-Nano-30B a NVFP4 con destilación consciente de la cuantificación (QAD) para una inferencia de razonamiento eficiente

Zhipu AI lanza GLM-4.7-Flash: un modelo MoE 30B-A3B para agentes y codificación local eficiente

Anuncio de la vista previa de Gemma 3n: IA potente, eficiente y centrada en los dispositivos móviles

Jina AI lanza Jina-VLM: un modelo de lenguaje de visión multilingüe de 2.400 millones centrado en el control de calidad visual eficiente con tokens

You missed

Vercel lanza Eve: un marco de agentes de IA de código abierto donde cada agente es un directorio de archivos asignados a capacidades

El ADN revela que un antiguo asesino ya era mortal hace 5.500 años: ScienceAlert

Microamp de Varsovia recauda 6,5 millones de euros para respaldar la tecnología de red europea 5G y 6G

Una partícula fantasma del mediodía cósmico apunta a una clase oculta de fábrica de neutrinos

Tag: eficiente

You missed