Se lanzó Athene-Llama3-70B: un LLM de peso abierto entrenado a través de RLHF basado en Llama-3-70B-Instruct

Nexusflow ha lanzado Atenea-Llama3-70B, Athene-70B es un modelo de chat de peso abierto perfeccionado a partir de Llama-3-70B de Meta AI. Athene-70B ha obtenido una puntuación Arena-Hard-Auto del 77,8 %, lo que rivaliza con modelos propietarios como GPT-4o y Claude-3.5-Sonnet. Esto marca una mejora significativa con respecto a su predecesor, Llama-3-70B-Instruct, que obtuvo una puntuación del 46,6 %. La mejora se debe a la secuencia de entrenamiento posterior dirigida de Nexusflow, diseñada para mejorar comportamientos de modelos específicos. Athene-70B se encuentra actualmente en pruebas públicas en Chatbot Arena.

Para maximizar el potencial de Llama-3-70B, Nexusflow desarrolló puntos de referencia internos que evalúan las capacidades de LLM en el seguimiento de instrucciones, codificación, escritura creativa y tareas multilingües. Con base en estas evaluaciones, se seleccionaron datos de preferencias de alta calidad para el aprendizaje de refuerzo a partir de la retroalimentación humana (RLHF, por sus siglas en inglés). Este proceso dio como resultado mejoras sustanciales en el rendimiento en comparación con Llama-3-70B-Instruct. Las mejoras abarcan aspectos clave como el seguimiento preciso de instrucciones, matemáticas y razonamiento, asistencia integral en la codificación, escritura creativa inspirada y dominio multilingüe.

Athene-70B demuestra la capacidad de Nexusflow para personalizar modelos según los requisitos empresariales específicos a través de una capacitación posterior específica. Basándose en los éxitos anteriores con Starling-7B y NexusRaven-V2, Nexusflow tiene como objetivo mejorar sus modelos para cumplir con los estándares de aplicaciones de nivel empresarial. La empresa ofrece soluciones personalizadas para ayudar a las empresas a destacarse en las tecnologías de agente y copiloto de GenAI. Nexusflow invita a las organizaciones a explorar cómo Athene-70B puede mejorar sus iniciativas de IA comunicándose con ellas para obtener más información y oportunidades de colaboración.

Athene-Llama3-70B, un modelo de chat de ponderaciones abiertas desarrollado por Nexusflow, demuestra mejoras significativas con respecto a su predecesor. El modelo logra un rendimiento competitivo en comparación con los modelos propietarios en el benchmark Arena-Hard-Auto. El proceso de post-entrenamiento específico de Nexusflow, que utiliza benchmarks internos y aprendizaje de refuerzo a partir de comentarios humanos, ha mejorado las capacidades del modelo en varios dominios, incluidos el seguimiento de instrucciones, las matemáticas y el razonamiento, la codificación, la escritura creativa y las tareas multilingües. Este avance muestra la capacidad de Nexusflow para adaptar los modelos a las necesidades empresariales, basándose en sus éxitos anteriores. La empresa se posiciona como un proveedor de soluciones de IA personalizadas de nivel empresarial, invitando a las organizaciones a explorar el potencial de Athene-70B para sus iniciativas de IA.

Revisar la Tarjeta modelo. Todo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro Subreddit de más de 46 000 millones de usuarios

Encuentra lo próximo Seminarios web sobre IA aquí

Asjad es consultor en prácticas en Marktechpost. Está cursando la licenciatura en ingeniería mecánica en el Instituto Indio de Tecnología de Kharagpur. Asjad es un entusiasta del aprendizaje automático y del aprendizaje profundo que siempre está investigando las aplicaciones del aprendizaje automático en el ámbito de la atención médica.

Se lanzó Athene-Llama3-70B: un LLM de peso abierto entrenado a través de RLHF basado en Llama-3-70B-Instruct

ByEquipo de 7 minutos

By Equipo de 7 minutos

Related Post

Google lanza Gemini-SQL2: Gemini 3.1 Pro Text-to-SQL obtiene una puntuación del 80,04 % en la tabla de clasificación de modelo único de BIRD

Zyphra lanza Zamba2-VL: modelos híbridos de lenguaje de visión Mamba2-Transformer que reducen el tiempo hasta el primer token en aproximadamente un orden de magnitud

Construido de adentro hacia afuera: cómo los servicios profesionales de AWS se convirtieron por primera vez en un equipo de vanguardia

You missed

¿Qué aerolíneas están prohibidas en la Unión Europea y por qué?

¿Quién es el hombre más rico del mundo? Top multimillonarios clasificados – Hollywood Life

¿Alguna vez has tenido una reunión de Recursos Humanos aterradora en tu calendario? Así descubrió la tripulación de Artemis 3 sus tareas

La diferencia cultural “no puede aceptarse como motivo para mitigar” la mala conducta relacionada con la deshonestidad de un abogado nacido en Etiopía