Se lanzaron versiones actualizadas de Command R (35B) y Command R+ (104B): dos modelos de lenguaje potentes con parámetros 104B y 35B para IA multilingüe

Cohere For AI presentó dos avances significativos en modelos de IA con el lanzamiento de Comando C4AI R+ 08-2024 y Comando C4AI R 08-2024 Modelos. Estos modelos de lenguaje de última generación están diseñados para impulsar lo que se puede lograr con la IA, especialmente en términos de generación de texto, razonamiento y uso de herramientas. Ofrecen implicaciones profundas tanto para la investigación como para las aplicaciones prácticas en varios dominios.

Descripción general de C4AI Command R+ 08-2024

El modelo C4AI Command R+ 08-2024 representa un salto monumental en las capacidades de IA. Es una versión de investigación de peso abierto con la asombrosa cantidad de 104 mil millones de parámetros. Este modelo está equipado con Retrieval Augmented Generation (RAG) y funcionalidades avanzadas de uso de herramientas que le permiten automatizar tareas complejas de varios pasos. Estas tareas incluyen resumen, respuesta a preguntas, razonamiento en varios contextos y más. El modelo está diseñado para interactuar con herramientas de manera sofisticada, combinando múltiples herramientas en varios pasos para lograr el resultado deseado.

Una de las características más destacadas del C4AI Command R+ 08-2024 es su capacidad multilingüe. El modelo ha sido entrenado en 23 idiomas, entre ellos inglés, español, francés, italiano, alemán y japonés. Este amplio entrenamiento lingüístico permite que el modelo se adapte a una audiencia global, lo que lo convierte en una herramienta versátil para aplicaciones internacionales. Además, ha sido evaluado en 10 idiomas, lo que garantiza su solidez y fiabilidad en entornos multilingües.

En términos de arquitectura, el C4AI Command R+ 08-2024 es un modelo de lenguaje autorregresivo que aprovecha una arquitectura de transformador optimizada. Después de su preentrenamiento inicial, el modelo se somete a un ajuste fino supervisado (SFT) y un entrenamiento de preferencias para alinear su comportamiento con las preferencias humanas, en particular en áreas de utilidad y seguridad. El modelo también utiliza Grouped Query Attention (GQA) para mejorar la velocidad de inferencia, lo que lo hace altamente eficiente en el procesamiento y la generación de texto.

Generación basada en la tierra y uso de herramientas

El C4AI Command R+ 08-2024 está diseñado específicamente con capacidades de generación fundamentadas. Esto significa que el modelo puede generar respuestas que no solo son contextualmente precisas, sino que también están respaldadas por fragmentos de documentos específicos proporcionados durante la fase de entrada. Esta capacidad es fundamental para las tareas que requieren que el modelo produzca resúmenes fundamentados o realice el paso final en RAG. Los tramos de fundamentación, o citas, que el modelo incluye en sus respuestas indican la fuente de la información, lo que hace que los resultados sean más confiables y verificables.

Las capacidades de uso de herramientas del modelo son otra área en la que se destaca. Se lo entrenó para manejar el uso de herramientas conversacionales, lo que le permite interactuar con varias herramientas durante una conversación. Esta interacción no se limita a una sola herramienta; el modelo puede emplear múltiples herramientas en diferentes etapas de una conversación para lograr objetivos más complejos. Por ejemplo, puede usar una herramienta repetidamente si la tarea lo exige, o puede usar una herramienta especial de respuesta directa para abstenerse de usar otras herramientas cuando no sea necesario.

Contexto, longitud y capacidades multilingües

Otra característica notable de C4AI Command R+ 08-2024 es su compatibilidad con una longitud de contexto extensa de 128 000 tokens. Este contexto extendido permite que el modelo mantenga la coherencia y la relevancia en conversaciones o documentos más largos, lo que lo hace útil para tareas que implican procesar grandes cantidades de información o generar resultados extensos.

Las capacidades multilingües del modelo mejoran aún más su utilidad. Con capacitación en 23 idiomas y evaluación en 10, el C4AI Command R+ 08-2024 es ideal para aplicaciones en diversos entornos lingüísticos. Esto lo convierte en una herramienta invaluable para iniciativas de investigación global, creación de contenido y sistemas de soporte al cliente que necesitan operar en diferentes idiomas.

C4AI Command R 08-2024: un compañero compacto

Si bien el C4AI Command R+ 08-2024 representa el pináculo del rendimiento con sus 104 mil millones de parámetros, Cohere también presentó un modelo más compacto, el C4AI Command R 08-2024, que contiene 35 mil millones de parámetros. A pesar de su menor tamaño, el C4AI Command R 08-2024 sigue siendo un modelo generativo de alto rendimiento con capacidades similares a las de su contraparte más grande, aunque en una escala reducida. El C4AI Command R 08-2024 está optimizado para razonamiento, resumen y respuesta a preguntas, al igual que el modelo Command R+. También admite la generación multilingüe, entrenada y evaluada en los mismos idiomas. Este modelo ofrece una opción más accesible para los usuarios que requieren IA de alto rendimiento dentro de un entorno computacional o de recursos más restringido.

Aplicaciones e implicaciones

El lanzamiento de estos dos modelos por parte de Cohere y Cohere For AI marca un avance significativo en la investigación de IA. Su naturaleza abierta significa que los investigadores y desarrolladores de todo el mundo pueden acceder y utilizar estas potentes herramientas para diversas aplicaciones, que van desde la investigación académica hasta las implementaciones prácticas en muchas industrias, como las finanzas, la atención médica y la atención al cliente. Además, el uso sofisticado de herramientas y las capacidades de generación fundamentadas del modelo C4AI Command R+ 08-2024 son particularmente prometedores para tareas que requieren alta precisión y comprensión contextual. Por ejemplo, en los campos legales o médicos, donde la recuperación y generación de información precisa son cruciales, estos modelos pueden mejorar significativamente la eficiencia y la confiabilidad de los sistemas impulsados ​​por IA.

Conclusión

El lanzamiento de los modelos C4AI Command R+ 08-2024 y C4AI Command R 08-2024 por parte de Cohere for AI representa un hito importante en la evolución de la IA. Estos modelos ofrecen capacidades de generación de texto, razonamiento y soporte multilingüe sin precedentes y abren nuevas posibilidades para automatizar tareas complejas mediante el uso avanzado de herramientas. Con los pesos abiertos que hacen que estas potentes herramientas sean accesibles para la comunidad de investigación global, Cohere for AI sienta las bases para futuras innovaciones que darán forma a la manera en que la IA se integra en aplicaciones complejas del mundo real.


Echa un vistazo a la Tarjeta modelo y Detalles. Todo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro Subreddit con más de 50 000 millones de usuarios

A continuación se muestra un seminario web muy recomendado por nuestro patrocinador: ‘Desarrollo de aplicaciones de IA de alto rendimiento con NVIDIA NIM y Haystack’


Asif Razzaq es el director ejecutivo de Marktechpost Media Inc. Como ingeniero y emprendedor visionario, Asif está comprometido con aprovechar el potencial de la inteligencia artificial para el bien social. Su iniciativa más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad de noticias sobre aprendizaje automático y aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.