AI21 Labs lanzó la familia de modelos abiertos Jamba 1.5: Jamba 1.5 Mini y Jamba 1.5 Large, que redefinen la inteligencia artificial de contexto largo con velocidad, calidad y capacidades multilingües inigualables para empresas globales

AI21 Labs ha dado un paso importante en el panorama de la IA al lanzar el Familia de modelos abiertos Jamba 1.5que comprende Jamba 1.5 Mini y Jamba 1.5 GrandeEstos modelos, basados ​​en la novedosa arquitectura SSM-Transformer, representan un gran avance en la tecnología de IA, en particular en el manejo de tareas de contexto largo. AI21 Labs tiene como objetivo democratizar el acceso a estos poderosos modelos al publicarlos bajo la Licencia de Modelo Abierto Jamba, lo que fomenta la experimentación y la innovación generalizadas.

Características principales de los modelos Jamba 1.5

Una de las características más destacadas de los modelos Jamba 1.5 es su capacidad para manejar contextos excepcionalmente largos. Cuentan con una ventana de contexto efectiva de 256 000 tokens, la más larga del mercado para modelos abiertos. Esta característica es fundamental para las aplicaciones empresariales que requieren el análisis y el resumen de documentos extensos. Los modelos también se destacan en flujos de trabajo de generación aumentada por recuperación (RAG) y de agentes, lo que mejora tanto la calidad como la eficiencia de estos procesos.

En cuanto a la velocidad, los modelos Jamba 1.5 son hasta 2,5 veces más rápidos en contextos largos que sus competidores y mantienen un rendimiento superior en todas las longitudes de contexto dentro de su categoría de tamaño. Esta ventaja de velocidad es crucial para las empresas que necesitan tiempos de respuesta rápidos para tareas como la atención al cliente o el procesamiento de datos a gran escala.

La calidad de los modelos Jamba 1.5 es otra área en la que eclipsan a sus pares. Jamba 1.5 Mini ha sido reconocido como el modelo abierto más fuerte en su clase de tamaño, logrando una puntuación de 46,1 en el benchmark Arena Hard, superando a modelos más grandes como Mixtral 8x22B y Command-R+. Jamba 1.5 Large va aún más allá, con una puntuación de 65,4, que supera a los modelos líderes como Llama 3.1 70B y 405B. Este rendimiento de alta calidad en diferentes benchmarks resalta la solidez de los modelos Jamba 1.5 a la hora de ofrecer resultados fiables y precisos.

Soporte multilingüe y preparación para desarrolladores

Además de su capacidad técnica, los modelos Jamba 1.5 están diseñados con soporte multilingüe, que abarca idiomas como español, francés, portugués, italiano, holandés, alemán, árabe y hebreo. Esto los convierte en herramientas versátiles para empresas globales que operan en diversos entornos lingüísticos.

Para los desarrolladores, los modelos de Jamba 1.5 ofrecen compatibilidad nativa con salida JSON estructurada, llamadas a funciones, digestión de objetos de documentos y generación de citas. Estas características hacen que los modelos se adapten a diversas necesidades de desarrollo, lo que permite una integración perfecta en los flujos de trabajo existentes.

Despliegue y eficiencia

AI21 Labs se ha asegurado de que los modelos Jamba 1.5 sean accesibles e implementables en múltiples plataformas. Están disponibles para su descarga inmediata en Hugging Face y cuentan con el respaldo de los principales proveedores de servicios en la nube, incluidos Google Cloud Vertex AI, Microsoft Azure y NVIDIA NIM. Se espera que los modelos estén disponibles pronto en plataformas adicionales como Amazon Bedrock, Databricks Marketplace, Snowflake Cortex y otras, lo que los hace fácilmente implementables en varios entornos, incluidos los locales y las nubes privadas virtuales.

Otra ventaja fundamental de los modelos Jamba 1.5 es su eficiencia en el uso de recursos. Estos modelos, que se basan en una arquitectura híbrida que combina las ventajas de las arquitecturas Transformer y Mamba, ofrecen un menor consumo de memoria, lo que permite a las empresas gestionar contextos extensos en una sola GPU. La novedosa técnica de cuantificación de AI21 Labs, ExpertsInt8, mejora aún más esta eficiencia, lo que optimiza el rendimiento del modelo sin comprometer la calidad.

Conclusión

El lanzamiento de la familia Jamba 1.5 por parte de AI21 Labs marca un avance significativo en el manejo de contextos extensos. Estos modelos establecen nuevos puntos de referencia en cuanto a velocidad, calidad y eficiencia, y democratizan el acceso a tecnología de IA de vanguardia a través de su licencia de modelo abierto. A medida que las empresas continúan buscando soluciones de IA que brinden valor en el mundo real, los modelos Jamba 1.5 se destacan como herramientas poderosas capaces de satisfacer las demandas de aplicaciones complejas y de gran escala. Su disponibilidad en múltiples plataformas y su compatibilidad con entornos multilingües mejoran aún más su atractivo, lo que los convierte en una opción versátil para desarrolladores y empresas.


Echa un vistazo a la Jamba 1.5 mini, Jamba 1.5 grandey Detalles. Todo el crédito por esta investigación corresponde a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo y únete a nuestro Canal de Telegram y LinkedIn Gr¡Arriba!. Si te gusta nuestro trabajo, te encantará nuestro hoja informativa..

No olvides unirte a nuestro Más de 49 000 suscriptores de ML en Reddit

Encuentra lo próximo Seminarios web sobre IA aquí


Asif Razzaq es el director ejecutivo de Marktechpost Media Inc. Como ingeniero y emprendedor visionario, Asif está comprometido con aprovechar el potencial de la inteligencia artificial para el bien social. Su iniciativa más reciente es el lanzamiento de una plataforma de medios de inteligencia artificial, Marktechpost, que se destaca por su cobertura en profundidad de noticias sobre aprendizaje automático y aprendizaje profundo que es técnicamente sólida y fácilmente comprensible para una amplia audiencia. La plataforma cuenta con más de 2 millones de visitas mensuales, lo que ilustra su popularidad entre el público.