Esta publicación fue escrita con Avdhesh Paliwal de Oldcastle APG.
Oldcastle APGuna de las redes globales más grandes de fabricantes en la industria de productos arquitectónicos, estaba lidiando con un proceso ineficiente e intensivo en mano de obra para manejar documentos de prueba de entrega (POD), conocidos como boletos de envío. La compañía estaba procesando 100,000–300,000 boletos de envío por mes en más de 200 instalaciones. Su sistema de reconocimiento de carácter óptico (OCR) existente no era confiable, requiriendo mantenimiento constante e intervención manual. Solo podría leer con precisión el 30-40% de los documentos, lo que lleva a un gasto significativo de tiempo y recursos.
Esta publicación explora cómo Oldcastle se asoció con AWS para transformar su flujo de trabajo de procesamiento de documentos utilizando Roca madre de Amazon con Amazon Textract. Discutimos cómo Oldcastle superó las limitaciones de su solución OCR anterior para automatizar el procesamiento de cientos de miles de documentos de POD cada mes, mejorando drásticamente la precisión al tiempo que reduce el esfuerzo manual. Esta solución demuestra un enfoque práctico y escalable que puede adaptarse a sus necesidades específicas, como desafíos similares que abordan el procesamiento de documentos o el uso de IA generativa para la optimización de procesos comerciales.
Desafíos con el procesamiento de documentos
El principal desafío para Oldcastle era encontrar una solución que pudiera lograr lo siguiente:
- Procesar con precisión un alto volumen de boletos de envío (POD) con una intervención humana mínima
- Escala para manejar 200,000–300,000 documentos por mes
- Manejar entradas inconsistentes como páginas giradas y formato variable
- Mejorar la precisión de la extracción de datos del 30-40% actual a una tasa mucho más alta
- Agregue nuevas capacidades como la validación de firma en los pods
- Proporcionar visibilidad en tiempo real en vainas y entregas sobresalientes
Además, Oldcastle necesitaba una solución para procesar las facturas de los proveedores y igualarlas con órdenes de compra, que presentaban desafíos similares debido a diferentes formatos de documentos. El proceso existente requería los despachadores en más de 200 instalaciones para gastar 4 a 5 horas al día procesando manualmente los boletos de envío manualmente. Esto consumió valiosos recursos humanos y condujo a demoras en el procesamiento y posibles errores en la entrada de datos. El equipo de TI estaba agobiado con constantes esfuerzos de mantenimiento y desarrollo para mantener el funcionamiento del sistema OCR poco confiable.
Descripción general de la solución
AWS Solutions Architects trabajó en estrecha colaboración con los ingenieros de Oldcastle para construir una solución que aborde estos desafíos. El flujo de trabajo de extremo a extremo usa Servicio de correo electrónico simple de Amazon (Amazon SES) para recibir boletos de envío, que se envían directamente de los conductores en el campo. El sistema procesa correos electrónicos a escala utilizando una arquitectura basada en eventos centrada en Notificaciones de eventos de Amazon S3. El flujo de trabajo envía documentos de boletos de barco a un orquestador de trabajo de cómputo de escala automático. Los documentos se procesan con los siguientes pasos:
- El sistema envía archivos PDF a Amazon Textract utilizando la API de análisis de documentos de inicio con diseño y características de firma.
- Los resultados de Amazon Textract son procesados por un AWS Lambda microservicio. Este microservicio resuelve problemas de rotación con el texto de la página y genera una colección de páginas de representación de Markdown del texto.
- El markdown se pasa a Amazon Bedrock, que extrae de manera eficiente los valores clave del texto de Markdown.
- El orquestador guarda los resultados a su Servicio de base de datos relacional de Amazon (Amazon RDS) para PostgreSQL base de datos.
El siguiente diagrama ilustra la arquitectura de la solución.
En esta arquitectura, Amazon Textract es una solución efectiva para manejar archivos PDF grandes a escala. La salida de Amazon Textract contiene las geometrías necesarias utilizadas para calcular la rotación y solucionar los problemas de diseño antes de generar Markdown. Los diseños de markdown de calidad son críticos para el lecho de roca de Amazon en la identificación de los pares de valor clave correctos del contenido. Además, optimizamos el costo extrayendo solo los datos necesarios para limitar los tokens de salida y utilizando el procesamiento de lotes de roca madre de Amazon para obtener el costo de token más bajo. Amazon Bedrock se usó para su rentabilidad y capacidad para procesar los boletos de envío de formatear donde los campos que deben extraerse son los mismos.
Resultados
La implementación utilizando esta arquitectura en AWS trajo numerosos beneficios a Oldcastle:
- Mejora del proceso comercial – La solución logró lo siguiente:
- Alivio la necesidad de procesamiento manual de boletos de envío en cada instalación
- Procesamiento de documentos automatizado con intervención humana mínima
- Precisión mejorada y confiabilidad de la extracción de datos
- Capacidad mejorada para validar firmas y rechazar documentos incompletos
- Proporcionó visibilidad en tiempo real en vainas y entregas sobresalientes
- Ganancias de productividad – Oldcastle vio los siguientes beneficios:
- Se gastaron significativamente menos horas humanas en la entrada de datos manuales y el procesamiento de documentos
- El personal tenía más tiempo para más actividades de valor agregado
- El equipo de TI se benefició de la reducción de los esfuerzos de desarrollo y mantenimiento
- Escalabilidad y rendimiento – El equipo experimentó las siguientes ganancias de rendimiento:
- Procesaron sin problemas de procesar unos pocos miles de documentos a 200,000–300,000 documentos por mes
- El equipo no observó problemas de rendimiento con un mayor volumen
- Satisfacción del usuario – La solución mejoró el sentimiento del usuario de varias maneras:
- Alta confianza del usuario en el nuevo sistema debido a su precisión y confiabilidad
- Comentarios positivos de los usuarios comerciales sobre la facilidad de uso y efectividad
- Rentable – Con este enfoque, Oldcastle puede procesar documentos a menos de $ 0.04 por página
Conclusión
Con el éxito de la implementación de AWS, Oldcastle está explorando la posible expansión a otros casos de uso, como el procesamiento de facturas AP, la validación de formulario W9 y los flujos de trabajo de aprobación de documentos automatizados. Este movimiento estratégico hacia el procesamiento de documentos con AI está posicionando a Oldcastle para mejorar la eficiencia y la escalabilidad en sus operaciones.
Revise sus procedimientos de procesamiento de documentos manuales actuales e identifique dónde el procesamiento de documentos inteligentes puede ayudarlo a automatizar estos flujos de trabajo para su negocio.
Para una mayor exploración y aprendizaje, recomendamos revisar los siguientes recursos:
Sobre los autores
Erik Cordsen es un arquitecto de soluciones en AWS que sirve a los clientes en Georgia. Le apasiona aplicar tecnologías de nubes y ML para resolver problemas de la vida real. Cuando no está diseñando soluciones en la nube, Erik disfruta de viajar, cocinar y ciclismo.
Sourabh Jain es un arquitecto de soluciones senior con más de 8 años de experiencia en el desarrollo de soluciones en la nube que generen mejores resultados comerciales para las organizaciones de todo el mundo. Se especializa en la arquitectura e implementación de soluciones robustas de software en la nube, con una amplia experiencia trabajando junto a equipos globales de Fortune 500 en diversas zonas horarias y culturas.
Avdhesh Paliwal es un arquitecto de aplicaciones consumado en Oldcastle APG con 29 años de extensa experiencia ERP. Su experiencia abarca módulos de fabricación, cadena de suministro y recursos humanos, con un historial probado de diseño e implementación de soluciones empresariales que impulsan la eficiencia operativa y el valor comercial.