NousResearch lanzó Nous-Hermes-2-Mixtral-8x7B: un LLM de código abierto con versiones SFT y DPO

En los modelos de lenguaje e inteligencia artificial, los usuarios a menudo enfrentan desafíos al entrenar y utilizar modelos para diversas tareas. Es evidente la necesidad de un modelo versátil y de alto rendimiento para comprender y generar contenido en diferentes dominios. Las soluciones existentes pueden proporcionar cierto nivel de rendimiento, pero deben ponerse al día para lograr resultados y adaptabilidad de última generación. El problema es un modelo de lenguaje avanzado que pueda sobresalir en la comprensión y generación de contenido en muchas tareas. Si bien hay otros modelos disponibles, es posible que las opciones existentes solo cumplan parcialmente los criterios de lograr rendimiento y versatilidad de vanguardia.

NousResearch acaba de lanzar Nous-Hermes-2-Mixtral-8x7B. Tiene 2 versiones, incluida una versión SFT y una DPO de este modelo. Nous Hermes 2 Mixtral 8x7B DPO tiene como objetivo abordar estos desafíos ofreciendo una solución de última generación. Este modelo, entrenado en un vasto conjunto de datos que comprende principalmente datos generados por GPT-4 y complementado con información de alta calidad de conjuntos de datos abiertos en el campo de la IA, exhibe un rendimiento excepcional en diversas tareas. Introduce una novedosa versión SFT + DPO y, para aquellos que prefieren un enfoque diferente, también está disponible una versión solo SFT.

El Nous Hermes 2 Mixtral 8x7B SFT es una versión especializada del último modelo de Nous Research, diseñada exclusivamente para ajustes supervisados. Está construido sobre la arquitectura Mixtral 8x7B MoE LLM. Este modelo se ha entrenado utilizando más de un millón de entradas, predominantemente generadas por GPT-4, junto con otros datos de alta calidad de varios conjuntos de datos abiertos en el campo de la IA. Demuestra un rendimiento excepcional en una amplia gama de tareas, estableciendo nuevos puntos de referencia en la industria.

El modelo Nous-Hermes-2-Mixtral-8x7B se ha sometido a pruebas comparativas con tareas GPT4All, AGIEval y BigBench. Los resultados demuestran mejoras significativas con respecto al modelo Mixtral base, superando incluso al modelo insignia Mixtral Finetune de MistralAI. El rendimiento promedio en estos puntos de referencia es un impresionante 75,70 para GPT4All, 46,05 para AGIEval y 49,70 para BigBench.

La introducción de ChatML como formato de solicitud permite una interacción más estructurada y atractiva con el modelo, particularmente en diálogos de chat de varios turnos. Las indicaciones del sistema permiten la direccionabilidad, brindando a los usuarios una forma matizada de guiar las respuestas del modelo en función de roles, reglas y elecciones estilísticas. Este formato, que se alinea con la compatibilidad de los terminales OpenAI, mejora la experiencia del usuario y hace que el modelo sea más accesible.

En conclusión, Nous Hermes 2 Mixtral 8x7B DPO es una solución poderosa para los desafíos de utilización y capacitación de modelos de lenguaje. Sus completos datos de entrenamiento, sus versiones innovadoras y sus impresionantes resultados comparativos lo convierten en un modelo versátil y de alto rendimiento. Con un enfoque en la interacción del usuario a través de ChatML y el compromiso de superar los puntos de referencia existentes, este modelo se destaca como una herramienta avanzada y eficaz en inteligencia artificial.

Niharika

" data-medium-file="https://www.marktechpost.com/wp-content/uploads/2023/01/1674480782181-Niharika-Singh-264x300.jpg" data-large-file="https://www.marktechpost.com/wp-content/uploads/2023/01/1674480782181-Niharika-Singh-902x1024.jpg"/>

Niharika es pasante de consultoría técnica en Marktechpost. Es estudiante de tercer año y actualmente cursa su licenciatura en tecnología en el Instituto Indio de Tecnología (IIT), Kharagpur. Es una persona muy entusiasta con un gran interés en el aprendizaje automático, la ciencia de datos y la inteligencia artificial y una ávida lectora de los últimos avances en estos campos.

NousResearch lanzó Nous-Hermes-2-Mixtral-8x7B: un LLM de código abierto con versiones SFT y DPO

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Una implementación de codificación de decodificación cerebral de extremo a extremo a partir de señales MEG utilizando NeuralSet y aprendizaje profundo para predecir características lingüísticas

Una guía de codificación sobre capacitación posterior a LLM con TRL desde el ajuste fino supervisado hasta el razonamiento DPO y GRPO

Cómo ser contratado en la era de la IA

You missed

Una implementación de codificación de decodificación cerebral de extremo a extremo a partir de señales MEG utilizando NeuralSet y aprendizaje profundo para predecir características lingüísticas

Los expertos revelan el secreto para ayudar a su mascota a perder peso: ScienceAlert

Trump se jacta de haber sido sometido a pruebas de demencia y dice que sus partidarios no pudieron aprobarlas

Cala Millor y Cala Bona estrenan zonas de aparcamiento exclusivas para residentes