Procese documentos de varias páginas con revisión humana utilizando Amazon Bedrock Data Automation y Amazon Sagemaker AI

Las organizaciones en todas las industrias enfrentan desafíos con altos volúmenes de documentos de varias páginas que requieren un procesamiento inteligente para extraer información precisa. Aunque la automatización ha mejorado este proceso, la experiencia humana todavía se necesita en escenarios específicos para verificar la precisión y calidad de los datos.

En marzo de 2025, AWS lanzó Amazon Bedrock Data Automationque permite a los desarrolladores automatizar la generación de ideas valiosas a partir de contenido multimodal no estructurado, incluidos documentos, imágenes, video y audio. Amazon Bedrock Data Automation optimiza los flujos de trabajo de procesamiento de documentos mediante la automatización de la extracción, la transformación y la generación de ideas a partir de contenido no estructurado. Minimiza las tareas que requieren mucho tiempo como la preparación de datos, la gestión del modelo, el ajuste, la ingeniería rápida y la orquestación a través de una API de inferencia multimodal unificada, que brinda una precisión líder en la industria a menor costo que las soluciones alternativas.

Amazon Bedrock Data Automation simplifica tareas complejas de procesamiento de documentos, incluida la división de documentos, la clasificación, la extracción, la normalización y la validación, al tiempo que se incorpora a la base visual con puntajes de confianza para la explicabilidad y la mitigación de alucinación incorporada, proporcionando ideas confiables de fuentes de datos no estructuradas. Sin embargo, aunque las capacidades avanzadas de la automatización de datos de roca madre de Amazon ofrecen una automatización excepcional, quedan escenarios en los que el juicio humano es invaluable. Aquí es donde la integración con Amazon Sagemaker AI Crea una poderosa solución de extremo a extremo. Al incorporar bucles de revisión humana en el flujo de trabajo de procesamiento de documentos, las organizaciones pueden mantener los niveles más altos de precisión al tiempo que mantienen la eficiencia del procesamiento. Con un bucle de revisión humana, las organizaciones pueden:

Validar las predicciones de IA cuando la confianza es baja
Manejar casos de borde y excepciones de manera efectiva
Mantener el cumplimiento regulatorio a través de la supervisión adecuada
Mantener una alta precisión mientras maximiza la automatización
Cree bucles de retroalimentación para mejorar el rendimiento del modelo con el tiempo

Al implementar estratégicamente los bucles humanos, las organizaciones pueden centrar la atención humana en partes inciertas de documentos al tiempo que permiten que los sistemas automatizados manejaran extracciones de rutina, creando un equilibrio óptimo entre eficiencia y precisión. En esta publicación, mostramos cómo procesar documentos de varias páginas con un bucle de revisión humana utilizando Amazon Bedrock Data Automation y Sagemaker AI.

Comprender los puntajes de confianza

Los puntajes de confianza son cruciales para determinar cuándo invocar la revisión humana. Los puntajes de confianza son el porcentaje de certeza que la automatización de datos de roca madre de Amazon tiene que su extracción es precisa.

Nuestro objetivo es simplificar el procesamiento de documentos inteligentes (IDP) al manejar el trabajo pesado del cálculo de precisión dentro de la automatización de datos de roca madre de Amazon. Esto ayuda a los clientes a centrarse en resolver sus desafíos comerciales con la automatización de datos de roca madre de Amazon en lugar de lidiar con mecanismos de puntuación complejos. Amazon Bedrock Data Automation optimiza sus modelos para el error de calibración esperado (ECE), una métrica que facilita una mejor calibración, lo que lleva a puntajes de confianza más confiables y precisos.

En los flujos de trabajo de procesamiento de documentos, los puntajes de confianza generalmente se interpretan como:

Alta confianza (90-100%) – Alta certeza sobre su extracción
Confianza media (70–89%) – certeza razonable con cierto potencial de error
Baja confianza (<70%) – Alta incertidumbre, que probablemente requiere verificación humana

Recomendamos probar la automatización de datos de roca madre de Amazon en sus propios conjuntos de datos específicos para determinar el umbral de confianza que desencadena un flujo de trabajo de revisión humana.

Descripción general de la solución

La siguiente arquitectura proporciona una solución sin servidor para procesar documentos de varias páginas con bucles de revisión humana utilizando Amazon Bedrock Data Automation y Sagemaker AI.

El flujo de trabajo consta de los siguientes pasos:

Los documentos se cargan a un Servicio de almacenamiento simple de Amazon (Amazon S3) Bucket de entrada, que sirve como punto de entrada para los documentos procesados a través de Amazon Bedrock Data Automation.
Un Amazon Eventbridge la regla detecta automáticamente los nuevos objetos en el cubo S3 y desencadena el Funciones del paso de AWS flujo de trabajo que orquesta la tubería de procesamiento de documentos.
Dentro del flujo de trabajo de las funciones de paso, el bda-document-processor AWS Lambda Se ejecuta la función, lo que invoca la automatización de datos de rock de Amazon con el plan apropiado. Amazon Bedrock Data Automation utiliza estas instrucciones preconfiguradas para extraer y procesar información del documento.
Amazon Bedrock Data Automation analiza el documento, extrae campos clave con puntajes de confianza asociados y almacena la salida procesada en otro cubo S3. Esta salida contiene la información extraída y los niveles de confianza correspondientes.
El flujo de trabajo de las funciones de paso invoca el bda-classifier Función Lambda, que recupera la salida de automatización de datos de rock racial de Amazon de Amazon S3. Esta función evalúa los puntajes de confianza contra los umbrales predefinidos para los campos extraídos.
Para los campos con puntajes de confianza por debajo del umbral, el flujo de trabajo enruta el documento a Sagemaker AI para Human Review. Usando la interfaz de usuario personalizada, los humanos revisan las tareas y validan los campos de las páginas. Los revisores pueden corregir campos que fueron extraídos incorrectamente por el proceso automatizado.
Los datos de formulario validado y corregido de la revisión humana se almacenan en un cubo S3.
Una vez que la salida de AI de Sagemaker se escribe en Amazon S3, ejecuta el bda-a2i-aggregator AWS Lambda que actualiza la carga útil de la salida de automatización de datos de Amazon Bedrock con el nuevo valor que fue revisado por Human. Esta salida agregada se almacena en Amazon S3. Esto proporciona la salida final de alta confianza lista para los sistemas aguas abajo.

Requisitos previos

Para implementar esta solución, necesita el Kit de desarrollo de la nube de AWS (AWS CDK), Node.js y Docker instalados en su máquina de implementación. Un script de compilación realiza el empaque y la implementación de la solución.

Implementar la solución

Complete los siguientes pasos para implementar la solución:

Clonar el repositorio de soluciones a su máquina de implementación.
Navegue al directorio del proyecto y ejecute el script de compilación:

./build.sh

La implementación crea los siguientes recursos en su cuenta de AWS:

Dos nuevos cubos S3: uno para la carga inicial de documentos y otro para la salida de documentos
Un proyecto de automatización de datos de roca madre de Amazon y cinco planos utilizados para procesar el documento de prueba
Un Amazon Cognito grupo de usuarios para la fuerza laboral privada que Amazon Sagemaker Ground Truth proporciona a Sagemaker AI para datos que están por debajo de una puntuación de confianza
Dos funciones lambda y un flujo de trabajo de función de paso utilizado para procesar los documentos de prueba
Dos Registro de contenedores elásticos de Amazon (Amazon ECR) Imágenes de contenedores utilizadas para las funciones Lambda para procesar los documentos de prueba

Agregue un nuevo trabajador a la fuerza laboral privada

Una vez que se complete la construcción, debe agregar un trabajador a la fuerza laboral privada en Sagemaker Ground Truth. Complete los siguientes pasos:

En la consola AI Sagemaker, debajo Verdad fundamental En el panel de navegación, elija Etiquetado de la fuerza laboralluego elige el Privado pestaña.

En el Trabajadores Sección, elija Invitar a los nuevos trabajadores.

Para Direcciones de correo electrónicoingrese las direcciones de correo electrónico de los trabajadores que desea invitar. Para este ejemplo, use un correo electrónico al que tenga acceso.
Elegir Invitar a los nuevos trabajadores.

Después de que se haya agregado el trabajador, recibirán un correo electrónico con una contraseña temporal. Este proceso puede tomar hasta 5 minutos antes de que se reciba el correo electrónico.

En el Etiquetado de la fuerza laboral página, en el Resumen de la fuerza laboral privada Sección, elija el enlace para Etiquetado URL de inicio de sesión del portal.

En el mensaje, ingrese la dirección de correo electrónico que utilizó anteriormente para configurar un trabajador y proporcionar la contraseña temporal desde el correo electrónico, luego elija Iniciar sesión.

Proporcione una nueva contraseña cuando se le solicite.

Será redirigido a una página de cola de trabajo para la fuerza laboral de etiquetado privado. En la parte superior de la página, un aviso establece que todavía no es miembro de un equipo de trabajo. Debe completar ese proceso en el siguiente paso para asegurarse de que los trabajos se asignen correctamente.

En el Etiquetado de la fuerza laboral página, abra el equipo privado (para esta publicación, bda-workforce).

En el Trabajadores pestaña, elija Agregar trabajadores al equipo.

Agregue el trabajador recientemente verificado al equipo.

Prueba la solución

Para probar la solución, cargue el documento de prueba ubicado en el assets Carpeta del proyecto al cubo S3 utilizado para documentos entrantes. Puede monitorear el progreso del sistema en la consola de funciones de paso o revisando los registros a través de Amazon CloudWatch. Después de procesar el documento, puede ver un nuevo trabajo en cola para el usuario en Sagemaker AI. Para ver este trabajo, navegue de regreso al Etiquetado de la fuerza laboral página y elija el enlace para Etiquetado URL de inicio de sesión del portal.

Inicie sesión con la dirección de correo electrónico y la contraseña actualizada desde antes. Verá una página que muestra los trabajos que se revisarán. Seleccione el trabajo y elija Empezar a trabajar.

En la interfaz de usuario, puede revisar cada elemento que estuvo por debajo de un puntaje de confianza (incumplido al 70%) para el documento procesado.

En esta página, puede modificar los datos a los valores corregidos. Los datos actualizados se guardarán en el cubo de salida S3 en el a2i-output/bda-review-flow-definition/<date>/review-loop-<date time stamp>/output.json archivo. Estos datos se pueden procesar y utilizar para proporcionar los valores corregidos para la información recuperada del documento.

Limpiar

Para finalizar todos los recursos creados en esta solución, ejecute el comando de flujo desde el directorio raíz del proyecto

CDK destruir

Conclusión

En esta publicación, demostramos cómo la combinación de la automatización de datos de la roca madre de Amazon y la IA de Sagemaker ofrecen eficiencia de automatización y precisión a nivel humano para el procesamiento de documentos de una sola página y multipaje.

Le recomendamos que explore este patrón con sus propios desafíos de procesamiento de documentos. La solución está diseñada para ser adaptable en varios tipos de documentos y se puede personalizar para cumplir con los requisitos comerciales específicos. Pruebe la implementación completa disponible en nuestro Repositorio de Github donde encontrará todo el código y la configuración necesarios para comenzar.

Para obtener más información sobre las soluciones de inteligencia de documentos en AWS, visite el Amazon Bedrock Data Automation y Documentación de AI de Sagemaker .

Comparta sus experiencias en los comentarios o comuníquese con los autores con preguntas. ¡Feliz edificio!

Sobre los autores

Joe Morotti es un arquitecto de soluciones en Amazon Web Services (AWS), que trabaja con clientes de servicios financieros en los Estados Unidos. Ha ocupado una amplia gama de roles técnicos y disfruta mostrando el arte del cliente de lo posible. Es un miembro activo de las comunidades de campo técnico de AWS para la IA generativa y Amazon Connect. En su tiempo libre, le gusta pasar tiempo de calidad con su familia explorando nuevos lugares y sobre el análisis de su equipo deportivo.

Prashanth Ramanathan es un arquitecto de soluciones senior en AWS, apasionada por las tecnologías generativas de IA, sin servidor y bases de datos. Es un ex ingeniero principal principal en una importante firma de servicios financieros y ha dirigido migraciones en la nube a gran escala y esfuerzos de modernización.

Andy Hall es un arquitecto de soluciones senior con AWS y se centra en ayudar a los clientes de servicios financieros con su transformación digital a AWS. Andy ha ayudado a las empresas a arquitectar, migrar y modernizar aplicaciones a gran escala a AWS. En los últimos 30 años, Andy ha liderado esfuerzos en torno al desarrollo de software, la arquitectura del sistema, el procesamiento de datos y los flujos de trabajo de desarrollo para grandes empresas.

Vikas Shah es un arquitecto de soluciones en Amazon Web Services que se especializa en inteligencia de documentos y soluciones con IA. Un entusiasta de la tecnología, combina su experiencia en el procesamiento de documentos, la búsqueda inteligente y la IA generativa para ayudar a las empresas a modernizar sus operaciones. Su enfoque innovador para resolver desafíos comerciales complejos se extiende a través de la gestión de documentos, la robótica y las tecnologías emergentes.

Procese documentos de varias páginas con revisión humana utilizando Amazon Bedrock Data Automation y Amazon Sagemaker AI

ByEquipo de 7 minutos

Comprender los puntajes de confianza

Descripción general de la solución

Requisitos previos

Implementar la solución

Agregue un nuevo trabajador a la fuerza laboral privada

Prueba la solución

Limpiar

Conclusión

Sobre los autores

By Equipo de 7 minutos

Related Post

Crawlee para Python: cree un canal de rastreo web con manejo de robots, gráficos de enlaces y exportación de fragmentos RAG

Cisco AI presenta FAPO: optimización rápida de canalización con atribución de fallas a nivel de paso y orquestación de código Claude

Nous Research actualiza el agente Hermes con un modo pizarra en blanco que fija conjuntos de herramientas a través de platform_toolsets.cli ydisabled_toolsets

You missed

Elche regresará a la antigua base mundialista de Messi para el campamento de pretemporada – The Leader

Blog de chismes deportivos n.° 1 en el mundo

Los relojes biológicos revelan factores ocultos que aceleran el envejecimiento: ScienceAlert

BEGOÑA Gómez | La Policía rechaza la “valoración especulativa” de Peinado sobre las escoltas de la esposa del presidente del Gobierno