El ajuste de la memoria de Lamini AI logra una precisión del 95 % y reduce las alucinaciones en un 90 % en modelos de lenguaje grandes

Lamini AI ha introducido un avance innovador en modelos de lenguaje grandes (LLM) con el lanzamiento de Ajuste de memoria Lamini. Esta técnica innovadora mejora significativamente la precisión fáctica y reduce las alucinaciones en los LLM, mejorando considerablemente las metodologías existentes. El método ya ha demostrado resultados impresionantes, logrando una precisión del 95% en comparación con el 50% que normalmente se observa con otros enfoques y reduciendo las alucinaciones del 50% a solo el 5%.

Lamini Memory Tuning aborda una paradoja fundamental en la IA: cómo garantizar la precisión de los hechos manteniendo las capacidades de generalización que hacen que los LLM sean versátiles y valiosos. Este método implica ajustar millones de adaptadores expertos (como adaptadores de bajo rango o LoRA) con datos precisos además de cualquier LLM de código abierto, como Llama 3 o Mistral 3. La técnica incorpora datos dentro del modelo para recuperar solo los más relevantes. información durante la inferencia, lo que reduce drásticamente la latencia y los costos y, al mismo tiempo, mantiene una alta precisión y velocidad.

La necesidad de un ajuste preciso de la memoria surge del diseño inherente de los LLM de propósito general, que están capacitados para reducir el error promedio en una amplia gama de ejemplos. Este diseño los hace competentes en muchas tareas pero perfectos en ninguna, lo que a menudo resulta en datos específicos confusos, como fechas o cifras de ingresos. Lamini Memory Tuning, sin embargo, optimiza para lograr cero errores en hechos particulares que se le proporcionan, lo que permite que el modelo recuerde estos hechos casi a la perfección sin comprometer sus capacidades de generalización.

Una historia de éxito notable es la de una empresa Fortune 500 que utilizó Lamini Memory Tuning para lograr una precisión del 95 % en aplicaciones críticas, mientras que los enfoques de vanguardia anteriores solo alcanzaban el 50 %. Este nivel de precisión es particularmente crucial para aplicaciones que requieren recordar datos exactos, como convertir preguntas en lenguaje natural en consultas de bases de datos SQL, donde la precisión es primordial.

Los métodos tradicionales como la generación aumentada de estimulación y recuperación (RAG) tienen su lugar para mejorar la precisión del LLM, pero a menudo no logran eliminar las alucinaciones. Estos métodos aumentan la probabilidad de obtener la respuesta correcta, pero aún así deben eliminar las respuestas casi correctas pero incorrectas. Lamini Memory Tuning supera esto combinando técnicas de recuperación de información con IA, enseñando al modelo que una respuesta casi correcta es tan incorrecta como una completamente incorrecta.

El enfoque innovador de Lamini Memory Tuning implica la creación de una combinación masiva de expertos en memoria (MoME) similares a índices especializados en sistemas de recuperación de información. Estos expertos están preparados para recordar hechos específicos con alta fidelidad y se seleccionan dinámicamente durante la inferencia. Este método preserva la capacidad del modelo para generar prosa fluida y garantiza un recuerdo casi perfecto de hechos críticos. El resultado es un modelo escasamente activado capaz de escalar a muchos parámetros manteniendo bajos costos de inferencia, extendiendo así las aplicaciones prácticas de los LLM a áreas previamente obstaculizadas por las alucinaciones.

En conclusión, implementar Lamini Memory Tuning representa una nueva frontera en el desarrollo y aplicación de LLM. Promete mayor precisión, menores costos y ciclos de desarrollo más rápidos, lo que permitirá una adopción e implementación más amplia en diversas industrias. A medida que Lamini AI continúa perfeccionando esta tecnología, el potencial de soluciones totalmente automatizadas y altamente precisas impulsadas por IA se vuelve cada vez más alcanzable.

Asif Razzaq es el director ejecutivo de Marktechpost Media Inc.. Como emprendedor e ingeniero visionario, Asif está comprometido a aprovechar el potencial de la inteligencia artificial para el bien social. Su esfuerzo más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad del aprendizaje automático y las noticias sobre aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.

🐝 Únase al boletín informativo de investigación de IA de más rápido crecimiento leído por investigadores de Google + NVIDIA + Meta + Stanford + MIT + Microsoft y muchos otros…

El ajuste de la memoria de Lamini AI logra una precisión del 95 % y reduce las alucinaciones en un 90 % en modelos de lenguaje grandes

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

NVIDIA lanza Nemotron-Labs-TwoTower: un modelo de lenguaje de difusión de peso abierto construido sobre una columna vertebral autorregresiva congelada Nemotron-3-Nano-30B-A3B

Simplifique el acceso de múltiples cuentas a los modelos de Amazon Bedrock con derechos administrados

CUP (Python útil común): creación de flujos de trabajo de Python confiables con el kit de herramientas de utilidad de Baidu

You missed

Conduzca más lento, ahorre dinero en gasolina. ¡Gracias Física!

Cómo las estadísticas se convierten en propaganda

Torrevieja lanza la campaña de compras de verano con más de 5.000€ en premios – The Leader

Danica Patrick genera expectación con una nueva foto junto al hombre misterioso