Las organizaciones multinacionales enfrentan el complejo desafío de administrar efectivamente una fuerza laboral y operaciones en diferentes países, culturas e idiomas. Mantener la consistencia y la alineación en estas operaciones globales pueden ser difícil, especialmente cuando se trata de actualizar y compartir documentos y procesos comerciales. Los retrasos o las falta de comunicaciones pueden conducir a pérdidas de productividad, ineficiencias operativas o posibles interrupciones comerciales. El intercambio preciso y oportuno de documentos traducidos en toda la organización es un paso importante para asegurarse de que los empleados tengan acceso a la información más reciente en su idioma nativo.
En esta publicación, mostramos cómo puede automatizar la localización de idiomas mediante la traducción de documentos utilizando Servicios web de Amazon (AWS). La solución combina Roca madre de Amazon y Tecnologías sin servidor de AWSun conjunto de servicios basados en eventos totalmente administrados para ejecutar código, administrar datos e integrar aplicaciones, todo sin administrar servidores. Amazon Bedrock es un servicio totalmente administrado que ofrece una selección de modelos básicos de alto rendimiento (FMS) de compañías de IA líderes como AI21 Labs, Anthrope, Cohere, Meta, Mistral AI e Stability AI. Se puede acceder a Amazon Bedrock a través de una sola API, junto con un amplio conjunto de capacidades que necesita para construir aplicaciones de IA generativas con seguridad, privacidad e IA responsable.
Descripción general de la solución
La solución usa Funciones del paso de AWS orquestar la traducción del documento fuente al idioma especificado (inglés, francés o español) usando AWS Lambda Funciones para llamar Amazon traducir. Tenga en cuenta que Amazon Translate actualmente admite la traducción de 75 idiomas y 3 han sido elegidos para esta demostración. Luego usa la roca madre de Amazon para refinar la traducción y crear contenido natural y fluido.
La construcción de esta solución, que se muestra en el siguiente diagrama, en tecnologías AWS totalmente administradas y sin servidor elimina la necesidad de operar infraestructura, gestionar la capacidad o invertir una financiación significativa por adelantado para evaluar el beneficio comercial. Los servicios de cómputo y AI utilizados para procesar documentos para la traducción se ejecutan solo a pedido, lo que resulta en un modelo de facturación basado en el consumo donde solo paga por su uso.
El flujo de trabajo de traducción y estandarización de documentos consta de los siguientes pasos:
- El usuario carga su documento fuente que requiere traducción al aporte Amazon Simple Storage Service (Amazon S3) balde. El cubo tiene tres carpetas: inglés, francés y español. El usuario carga el documento de origen con la carpeta que coincide con el idioma actual del documento. Esto se puede hacer utilizando la consola de administración de AWS, el Interfaz de línea de comandos de AWS (AWS CLI)o herramientas de terceros que les permiten navegar un cubo S3 como un sistema de archivos.
- La presencia de un nuevo documento en el cubo de entrada inicia el flujo de trabajo de las funciones de paso que usa Notificaciones de eventos de Amazon S3.
- El primer paso de este flujo de trabajo es un AWS Lambda función que recupera el documento de origen del cubo, lo guarda en almacenamiento temporal y llama a la API de Amazon Translate
TranslateDocumentespecificando el documento de origen como el objetivo para la traducción. - El segundo paso del flujo de trabajo es otra función Lambda que consulta el lecho de roca de Amazon utilizando un indicador precenerado con el documento de origen traducido incluido como el objetivo. Este aviso instruye a Amazon Bedrock que realice una verificación de transcreación en el contenido del documento. Esto valida que se mantiene la intención, el estilo y el tono del documento. La versión final del documento ahora se guarda en el producción S3 Bucket.
- El último paso del flujo de trabajo usa Servicio de notificación simple de Amazon (Amazon SNS) Para notificar a un Tema de SNS del resultado del flujo de trabajo (éxito o fracaso). Esto enviará un correo electrónico a los suscriptores al tema.
- El usuario descarga su documento traducido del producción S3 Bucket. Esto se puede hacer utilizando la consola, la CLI de AWS o las herramientas de terceros que les permiten navegar por un cubo S3 como un sistema de archivos.
Esta solución está disponible en GitHub y proporciona el Kit de desarrollo de la nube de AWS (AWS CDK) Código para implementar en su propia cuenta AWS. El AWS CDK es un marco de desarrollo de software de código abierto para definir la infraestructura en la nube como código (IAC) y aprovisionarlo AWS CloudFormation. Esto proporciona un proceso de implementación automatizado para su cuenta AWS.
Requisitos previos
Para este tutorial, debe tener los siguientes requisitos previos:
Pasos de implementación
Para implementar esta solución en su propia cuenta de AWS:
- Abra su editor de códigos de elección y autentique en su cuenta AWS. Las instrucciones para vincular el código de Visual Studio se pueden encontrar en Autenticación y acceso para el kit de herramientas de AWS para el código Visual Studio.
- Clon la solución del repositorio de GitHub:
- Siga las instrucciones de implementación en el archivo ReadMe del repositorio.
- Después de implementar la pila, vaya a la consola S3. Navegue al cubo S3 que se creó: docstandardizationstack-inputbucket. Cargue el archivo word_template.docx que está incluido en el repositorio. Las carpetas inglesas, francesas y de español se crearán automáticamente.
- Navegar al Servicio de notificación simple de Amazon (Amazon SNS) Consola y cree una suscripción al tema DocStandardizationStack-ResultTopic creado por la pila. Después de que se cree, asegúrese de confirmar la suscripción al tema antes de probar el flujo de trabajo eligiendo el Confirmar suscripción Enlace en el correo electrónico automatizado que recibe de SNS.
- Después de que se haya suscrito al tema, puede probar el flujo de trabajo.
Traducción de idiomas
Para probar el flujo de trabajo, cargue un archivo .docx en la carpeta correspondiente al idioma original del documento. Por ejemplo, si está cargando un documento que se escribió en inglés, este documento debe cargarse en la carpeta inglesa. Si no tiene un archivo .docx disponible, puede usar el archivo tone_test.docx que está incluido en el repositorio.
La máquina de estado de las funciones de paso comenzará después de cargar su documento. Las versiones traducidas de su documento de entrada fuente se agregarán a las otras carpetas que se crearon en el Paso 5. En este ejemplo, subimos un documento en inglés y el documento se tradujo tanto en español como en francés.
Proceso de transcreación
Los documentos traducidos se procesan luego utilizando Amazon Bedrock. Amazon Bedrock revisa la intención, el estilo y el tono de los documentos para usar en un entorno comercial. Puede personalizar el tono y el estilo de salida modificando el indicador de roca madre de Amazon para que coincida con sus requisitos específicos. Los documentos finales se agregan al cubo de salida S3 con un sufijo de _correctado, y cada documento se agrega a la carpeta que corresponde al idioma del documento. El cubo de salida tiene el mismo formato que el cubo de entrada, con una carpeta separada creada para cada idioma.
El aviso utilizado para instruir al modelo AI generativo para la tarea de transcreación ha sido diseñado para producir ajustes consistentes y válidos. Incluye instrucciones específicas, que cubren tanto qué tipo de cambios se esperan del modelo y las reglas para definir límites que controlan los ajustes. Puede ajustar este aviso si es necesario para cambiar el resultado del flujo de trabajo de procesamiento de documentos.
Los documentos finales tendrán un sufijo de _correctado.
Cuando se hayan procesado los documentos, recibirá una notificación SNS. Podrá descargar los documentos procesados del s3 bucket docstandardizationstack-outputbucket.
Limpiar
Para eliminar los recursos implementados, ejecute el comando cdk destroy En su terminal, o use la consola CloudFormation para eliminar la pila CloudFormation DocStandardizationStack.
Conclusión
En esta publicación, exploramos cómo automatizar la traducción de documentos comerciales utilizando AWS AI y Tecnologías sin servidor. A través de este proceso de traducción automatizado, las empresas pueden mejorar la comunicación, la consistencia y la alineación en sus operaciones globales, asegurándose de que los empleados puedan acceder a la información que necesitan cuando la necesitan. A medida que las organizaciones continúan expandiendo su huella global, herramientas como esta serán cada vez más importantes para mantener una fuerza laboral cohesiva e informada, sin importar en qué parte del mundo puedan estar ubicados. Al adoptar las capacidades de AWS, las empresas pueden centrarse en sus objetivos comerciales centrales sin crear una sobrecarga adicional de infraestructura de TI.
¡Traducción de Bonne!
Feliz traducción!
¡Feliz traducción!
Lectura adicional
La solución incluye un indicador de disparo cero con instrucciones específicas que dirigen lo que el LLM debería y no debe modificar en el documento de origen. Si desea iterar en el indicador proporcionado para ajustar sus resultados, puede usar el Amazon Bedrock Administration Herramienta para editar y probar rápidamente el impacto de los cambios en el texto de inmediato.
Para ver ejemplos adicionales que usen Amazon Bedrock y otros servicios, visite el Talleres de AWS página para comenzar.
Sobre los autores
Nadhya Polanco es un arquitecto de soluciones asociadas en AWS con sede en Bruselas, Bélgica. En este rol, apoya a las organizaciones que buscan incorporar la IA y el aprendizaje automático en sus cargas de trabajo. En su tiempo libre, a Nadhya le gusta disfrutar de su pasión por el café y explorar nuevos destinos.
Steve Bell es un arquitecto senior de soluciones en AWS con sede en Amsterdam, Países Bajos. Ayuda a las organizaciones empresariales a navegar las complejidades de la migración, la modernización y la estrategia multicloud. Fuera del trabajo le encanta caminar por su Labrador, Lily y practicar sus habilidades de barbacoa aficionadas.