Amazon SageMaker presenta el modelo de ajuste fino Cohere Command R

AWS anunció la disponibilidad del modelo de ajuste fino Cohere Command R en Amazon SageMakerEsta última incorporación al conjunto de capacidades de aprendizaje automático (ML) de SageMaker permite a las empresas aprovechar el poder de los modelos de lenguaje grandes (LLM) y liberar todo su potencial para una amplia gama de aplicaciones.

Cohere Command R es un modelo escalable y de vanguardia diseñado para gestionar cargas de trabajo de nivel empresarial con facilidad. Cohere Command R está optimizado para la interacción conversacional y las tareas de contexto extensas. Está dirigido a la categoría escalable de modelos que equilibran el alto rendimiento con una gran precisión, lo que permite a las empresas pasar de la prueba de concepto a la producción. El modelo cuenta con una alta precisión en las tareas de recuperación, generación aumentada (RAG) y uso de herramientas, baja latencia y alto rendimiento, una longitud de contexto extensa de 128 000 tokens y sólidas capacidades en 10 idiomas clave.

En esta publicación, exploramos las razones para ajustar un modelo y el proceso de cómo lograrlo con Cohere Command R.

Ajuste fino: adaptación de los LLM a casos de uso específicos

El ajuste fino es una técnica eficaz para adaptar los LLM como Cohere Command R a dominios y tareas específicos, lo que genera mejoras significativas en el rendimiento con respecto al modelo base. Las evaluaciones del modelo Cohere Command R ajustado han demostrado una mejora del rendimiento de más del 20 % en varios casos de uso empresarial en sectores como los servicios financieros, la tecnología, el comercio minorista, la atención médica, el derecho y la atención sanitaria. Debido a su menor tamaño, un modelo Cohere Command R ajustado se puede utilizar de forma más eficiente en comparación con modelos mucho más grandes que su clase.

La recomendación es utilizar un conjunto de datos que contenga al menos 100 ejemplos.

Cohere Command R utiliza un enfoque RAG, que recupera el contexto relevante de una base de conocimiento externa para mejorar los resultados. Sin embargo, el ajuste fino le permite especializar aún más el modelo. El ajuste fino de los modelos de generación de texto como Cohere Command R es crucial para lograr el máximo rendimiento en varios escenarios:

  • Adaptación específica del dominio: los modelos RAG pueden no funcionar de manera óptima en dominios altamente especializados como finanzas, derecho o medicina. El ajuste fino le permite adaptar el modelo a los matices de estos dominios para mejorar la precisión.
  • Aumento de datos: el ajuste fino permite incorporar fuentes de datos o técnicas adicionales, aumentando la base de conocimientos del modelo para lograr una mayor solidez, especialmente con datos escasos.
  • Control de grano fino: aunque RAG ofrece capacidades generales impresionantes, el ajuste fino permite un control detallado sobre el comportamiento del modelo, adaptándolo con precisión a la tarea deseada para lograr la máxima precisión.

La potencia combinada de RAG y los LLM perfeccionados le permiten afrontar diversos desafíos con una versatilidad y una eficacia incomparables. Con la introducción del ajuste fino de Cohere Command R en SageMaker, las empresas ahora pueden personalizar y optimizar el rendimiento del modelo para sus requisitos únicos. Al realizar ajustes en datos específicos del dominio, las empresas pueden mejorar la precisión, la relevancia y la eficacia de Cohere Command R para sus casos de uso, como el procesamiento del lenguaje natural, la generación de texto y la respuesta a preguntas.

Al combinar la escalabilidad y la solidez de Cohere Command R con la capacidad de ajustar su rendimiento en SageMaker, AWS permite a las empresas navegar por las complejidades de la adopción de IA y utilizar su poder transformador para impulsar la innovación y el crecimiento en diversas industrias y dominios.

Los datos del cliente, incluidos los avisos, las finalizaciones, los modelos personalizados y los datos utilizados para el ajuste o el entrenamiento previo continuo, siguen siendo privados para las cuentas de AWS del cliente y nunca se comparten con proveedores de modelos externos.

Descripción general de la solución

En las siguientes secciones, repasaremos los pasos necesarios para ajustar el modelo R de Cohere Command en SageMaker. Esto incluye la preparación de los datos, la implementación de un modelo, la preparación para el ajuste, la creación de un punto final para la inferencia y la realización de la inferencia.

Preparar los datos de ajuste fino

Antes de poder comenzar un trabajo de ajuste, debe cargar un archivo conjunto de datos con datos de entrenamiento y (opcionalmente) evaluación.

En primer lugar, asegúrese de que sus datos estén en formato jsonl. Deben tener la siguiente estructura:

  • mensajes – Contiene una lista de mensajes de la conversación. Un mensaje consta de las siguientes partes:
  • role – Especifica el orador actual. Puedes elegir entre Sistema, Usuario o Chatbot.
  • contenido – Aquí se encuentra el contenido del mensaje.

El siguiente es un ejemplo que entrena a un chatbot para responder preguntas. Para facilitar la lectura, el documento se extiende a lo largo de varias líneas. Para su conjunto de datos, asegúrese de que cada línea contenga un ejemplo completo.

{
  "messages": [
    {
      "role": "System",
      "content": "You are a large language model trained by Cohere."
    },
    {
      "role": "User",
      "content": "Hi! What were Time magazines top 10 cover stories in the last 10 years?"
    },
    {
      "role": "Chatbot",
      "content": "Time magazines top 10 cover stories in the last 10 years were:\\n\\n1. Volodymyr Zelenskyy\\n2. Elon Musk\\n3. Martin Luther King Jr.\\n4. How Earth Survived\\n5. Her Lasting Impact\\n6. Nothing to See Here\\n7. Meltdown\\n8. Deal With It\\n9. The Top of America\\n10. Bitter Pill"
    },
    {
      "role": "User",
      "content": "Who is Volodymyr Zelenskyy?"
    },
    {
      "role": "Chatbot",
      "content": "Volodymyr Zelenskyy is a Ukrainian politician who was elected President of Ukraine in 2019. He previously served as the Minister of Internal Affairs in the government of Prime Minister Volodymyr Groysman."
    },
    {
      "role": "User",
      "content": "Thank you!"
    }
  ]
}

Implementar un modelo

Complete los siguientes pasos para implementar el modelo:

  1. En Mercado de AWSsuscríbete al modelo Cohere Command R

Después de suscribirse al modelo, puede configurarlo y crear un trabajo de capacitación.

  1. Elegir Ver en Amazon SageMaker.
  2. Siga las instrucciones en la interfaz de usuario para crear un trabajo de capacitación.

Alternativamente, puede utilizar lo siguiente ejemplo de cuaderno para crear el puesto de formación.

Prepárese para el ajuste fino

Para afinar el modelo, necesitará lo siguiente:

  • ARN del producto – Esto se le proporcionará después de suscribirse al producto.
  • Conjunto de datos de entrenamiento y conjunto de datos de evaluación – Prepare sus conjuntos de datos para realizar ajustes.
  • Ubicación de Amazon S3 – Especifique la ubicación de Amazon Simple Storage Service (Amazon S3) que almacena los conjuntos de datos de entrenamiento y evaluación.
  • Hiperparámetros – El ajuste fino generalmente implica ajustar varios hiperparámetros, como la tasa de aprendizaje, el tamaño del lote, la cantidad de épocas, etc. Debe especificar los rangos o valores de hiperparámetros adecuados para su tarea de ajuste fino.

Crear un punto final para la inferencia

Cuando se complete el ajuste, puede crear un punto final para la inferencia con el modelo ajustado. Para crear el punto final, utilice el create_endpoint método. Si el punto final ya existe, puede conectarse a él mediante el método connect_to_endpoint método.

Realizar inferencia

Ahora puede realizar inferencias en tiempo real mediante el punto de conexión. El siguiente es el mensaje de muestra que se utiliza como entrada:

message = "Classify the following text as either very negative, negative, neutral, positive or very positive: mr. deeds is , as comedy goes , very silly -- and in the best way."
result = co.chat(message=message)
print(result)

La siguiente captura de pantalla muestra la salida del modelo ajustado.


Opcionalmente, también puede probar la precisión del modelo utilizando los datos de evaluación (sample_finetune_scienceQA_eval.jsonl).

Limpiar

Una vez que haya terminado de ejecutar el cuaderno y de experimentar con el modelo optimizado de Cohere Command R, es fundamental que limpie los recursos que ha aprovisionado. Si no lo hace, es posible que se acumulen cargos innecesarios en su cuenta. Para evitarlo, utilice el siguiente código para eliminar los recursos y detener el proceso de facturación:

co.delete_endpoint()
co.close()

Resumen

Cohere Command R con ajuste fino le permite personalizar sus modelos para que sean eficientes para su negocio, dominio e industria. Junto con el modelo ajustado, los usuarios también se benefician de la competencia de Cohere Command R en los lenguajes comerciales más utilizados (10 idiomas) y RAG con citas para obtener información precisa y verificada. Cohere Command R con ajuste fino logra altos niveles de rendimiento con un menor uso de recursos en casos de uso específicos. Las empresas pueden ver menores costos operativos, latencia mejorada y mayor rendimiento sin grandes demandas computacionales.

Empiece a construir con Cohere modelo de ajuste fino en SageMaker hoy.


Sobre los autores

Shashi Raina Shashi es socio sénior de arquitectura de soluciones en Amazon Web Services (AWS), donde se especializa en brindar soporte a empresas emergentes de inteligencia artificial generativa (GenAI). Con casi 6 años de experiencia en AWS, Shashi ha desarrollado una gran experiencia en una variedad de dominios, incluidos DevOps, análisis e inteligencia artificial generativa.

James Yi es arquitecto sénior de soluciones para socios de IA/ML en el equipo de tecnologías emergentes de Amazon Web Services. Le apasiona trabajar con clientes y socios empresariales para diseñar, implementar y escalar aplicaciones de IA/ML para obtener valor comercial. Fuera del trabajo, disfruta jugando al fútbol, ​​viajando y pasando tiempo con su familia.

Pradeep Prabhakaran Pradeep es arquitecto de soluciones para clientes en Cohere. En su puesto actual en Cohere, Pradeep actúa como asesor técnico de confianza para clientes y socios, y les proporciona orientación y estrategias para ayudarlos a aprovechar todo el potencial de la innovadora plataforma de inteligencia artificial generativa de Cohere. Antes de unirse a Cohere, Pradeep fue gerente principal de soluciones para clientes en Amazon Web Services, donde dirigió programas de transformación de la nube empresarial para grandes empresas. Antes de trabajar en AWS, Pradeep ocupó varios puestos de liderazgo en empresas de consultoría como Slalom, Deloitte y Wipro. Pradeep tiene una licenciatura en ingeniería y reside en Dallas, Texas.