AI ha sido testigo de avances rápidos en PNL en los últimos años, sin embargo, muchos modelos existentes aún luchan por equilibrar las respuestas intuitivas con un razonamiento profundo y estructurado. Si bien es competente en fluidez conversacional, los modelos tradicionales de chat de IA a menudo no se encuentran cuando se enfrentan a consultas lógicas complejas que requieren análisis paso a paso. Por otro lado, los modelos optimizados para el razonamiento tienden a perder la capacidad de participar en interacciones suaves y naturales. Esta brecha ha desafiado a los desarrolladores, investigadores y empresas que buscan una IA en transición sin problemas entre diferentes estilos cognitivos.
Vista previa de Deephermes 3 (Deephermes-3-llama-3-8b-preview) es la última iteración en la serie de LLM de Nous Research. Como uno de los primeros modelos en integrar tanto el procesamiento de pensamiento de cadena larga basada en el razonamiento como los mecanismos de respuesta convencionales de LLM, Deephermes 3 marca un paso significativo en la sofisticación del modelo de IA. Esta versión de vista previa del modelo refina la anotación de IA, las capacidades de juicio y las llamadas de funciones, ofreciendo una herramienta de IA más avanzada y flexible para investigadores, desarrolladores y empresas.
La característica central de Deephermes 3 es su capacidad para cambiar entre un razonamiento intuitivo y profundo, lo que permite a los usuarios personalizar cómo el modelo procesa y ofrece información. El modelo es una actualización de su predecesor, Hermes 3, que trajo capacidades de agente, un diálogo de juego de rol más rico, una mayor profundidad de conversación de giro múltiple y una mayor coherencia en un contexto más largo. El objetivo general de la serie Hermes siempre ha sido hacer que la salida de IA sea consistente con la intención del usuario, lo que le da al usuario final un control significativo sobre la generación de respuesta. Esta versión es una desviación de los modelos anteriores, con su modo de procesamiento de doble procesamiento que le permite realizar respuestas conversacionales normales y apoyar un razonamiento complejo. Un mensaje del sistema puede desencadenar la función de razonamiento profundo, permitiendo un procesamiento lógico extendido para mejorar la precisión de la respuesta.
Deephermes 3 ha sufrido una rigurosa evaluación comparativa para validar sus capacidades de razonamiento. Utilizando el conjunto de evaluación de abrazadera de Face Open-R1, el modelo demostró un rendimiento significativamente mejorado sobre los modelos estándar sintonizados con instrucciones. Los puntos de referencia para el modo de razonamiento “encendido” revelaron ganancias notables en la resolución compleja de problemas, particularmente en tareas de razonamiento matemático, en comparación con modelos que no incorporan mecanismos de pensamiento profundos. En comparación con Meta’s Llama-3.1-8b, el modelo Deephermes 3 mostró resultados competitivos o superiores en múltiples categorías de pruebas, mostrando mejoras en la coherencia contextual, el razonamiento de múltiples pasos y la retención de memoria conversacional.
Deephermes 3 ha adoptado el formato de LLAMA-CHAT para las indicaciones del sistema, un método estructurado que mejora su capacidad para procesar conversaciones múltiples y respuestas impulsadas por el contexto. Las indicaciones del sistema introducen nuevas posibilidades para la participación del usuario, lo que permite a las personas guiar las elecciones estilísticas del modelo, la asignación de roles y las reglas interactivas. Con su modo de razonamiento profundo mejorado, el modelo puede manejar una lógica de cadena larga que se extiende a través de miles de tokens. Este modo garantiza una mayor precisión de respuesta en tareas que requieren una comprensión contextual extensa, como consultas de programación complejas, resolución de problemas matemáticos y razonamiento analítico detallado.
El modelo se puede implementar utilizando la biblioteca de transformadores de cara de abrazo, que permite a los desarrolladores personalizar las implementaciones para varias tareas. Debido a su integración flexible de API, DeepHermes 3 se puede utilizar en sistemas empresariales, aplicaciones de chatbot y sistemas de investigación donde se deben procesar consultas estructuradas y no estructuradas. Además, el modelo tiene una característica mejorada de funciones que facilita el procesamiento eficiente de las salidas estructuradas con JSON. Esta característica lo hace ideal para aplicaciones estructuradas de extracción de datos, como informes financieros automatizados, automatización del servicio al cliente y sistemas de toma de decisiones basados en la IA en tiempo real.
En conclusión, esta versión reúne mecanismos de respuesta intuitivos de las respuestas tradicionales de forma humana y una cadena extendida de razonamiento cognitivo, mejorando así tanto la precisión de la respuesta como la eficacia general del modelo. Con los avances en la funcionalidad autónoma, el juego de roles, el diálogo múltiple y la invocación funcional, Deephermes 3 es consistente con el impulso general de la serie sobre gobernanza y navegabilidad centradas en el usuario. Aunque se presenta como una versión temprana con capacidades de razonamiento rudimentarias, tiene una promesa en las tareas que ganan del razonamiento objetivo. Los usuarios pueden activar su modo de pensamiento profundo utilizando un sistema de sistema especial que induce al modelo a participar en un razonamiento extenso antes de responder.
Verificar Modelo en Huggingface. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, siéntete libre de seguirnos Gorjeo Y no olvides unirte a nuestro 75k+ ml de subreddit.
Sana Hassan, una pasante de consultoría en MarktechPost y estudiante de doble grado en IIT Madras, le apasiona aplicar tecnología e IA para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.