A medida que las organizaciones buscan obtener un mayor valor de sus datos de apoyo de AWS, los equipos operativos están buscando formas de transformar casos de apoyo en bruto y eventos de salud en ideas procesables. Si bien las herramientas de análisis tradicionales pueden proporcionar capacidades básicas de informes, los equipos necesitan soluciones más sofisticadas que puedan comprender y procesar consultas de lenguaje natural sobre sus datos operativos. La arquitectura de generación de recuperación acuática (RAG) forma la base para optimizar grandes resultados del modelo de idioma haciendo referencia a bases de conocimiento autorizadas fuera de sus datos de capacitación antes de generar respuestas. Esta arquitectura utiliza el poder de la búsqueda semántica y las capacidades de recuperación de información para mejorar la precisión.
En nuestra publicación de blog anterior, Derive ideas operativas significativas y procesables de AWS utilizando Amazon Q Businesspresentamos una solución a base de trapo utilizando Amazon Q Business. Sin embargo, si bien este enfoque sobresale en la búsqueda semántica, puede enfrentar desafíos con análisis numéricos y agregaciones precisas. En esta publicación, abordamos estas limitaciones mostrando cómo puede mejorar Amazon Q con complementos personalizados para mejorar el análisis de soporte y la respuesta de incidentes. Nuestra solución combina las fortalezas de RAG con consultas de datos estructurados, lo que permite respuestas más precisas a preguntas analíticas sobre sus datos de soporte de AWS. Las instrucciones de implementación detalladas para la solución en esta publicación están disponibles en nuestro AWS muestras repositorio de github.
Comprender el diseño de Rag para Analytics
La arquitectura de RAG sobresale para encontrar información relevante a través de la coincidencia basada en el contexto, lo que permite las interacciones del lenguaje natural con datos externos. Sin embargo, la arquitectura fundamental de la búsqueda de similitud vectorial, que prioriza la relevancia semántica sobre las capacidades de agregación analítica, puede introducir inexactitudes significativas. Examinemos esta limitación con una consulta simple:
La siguiente es una respuesta de solo trapo que indica que el sistema intenta juntar información de varios documentos, informando 190 casos a través de agregaciones potencialmente alucinadas.
Sin embargo, cuando se mejora con capacidades de consulta de datos estructuradas, la misma consulta produce 958 casos de soporte, el recuento preciso verificado contra el conjunto de datos real:
Esta limitación se vuelve aún más evidente con consultas moderadamente complejas que requieren un análisis categórico:
La siguiente es una respuesta solo en trapo que muestra un desglose categórico limitado o inexacto:
Con la consulta de datos estructuradas, obtenemos distribuciones de gravedad precisas:
La brecha se amplía aún más cuando se trata de análisis multidimensional. Considere la siguiente consulta multidimensional esperando un análisis detallado con combinaciones de servicios y patrones temporales.
Consulta:
Respuesta:
La siguiente es una respuesta de solo trapo que muestra incapacidad para procesar la misma consulta compleja:
Estos ejemplos demuestran cómo RAG solo lucha con consultas analíticas de aumento de la complejidad, mientras que nuestra solución mejorada por complementos ofrece un análisis preciso y estructurado en cada nivel. Cuando trabajamos con escenarios que requieren un análisis numérico preciso, podemos mejorar las capacidades de RAG a través de enfoques estructurados:
- Análisis de agregación y patrones: Cuando las indicaciones del usuario incluyen consultas de agregación (como recuentos, totales o distribuciones), requieren un cálculo numérico exacto a través de consultas estructuradas para proporcionar resultados precisos. La búsqueda de similitud vectorial por sí sola no puede garantizar agregaciones numéricas precisas, lo que hace que la consulta de metadatos estructurados sea esencial para estos casos de uso analítico.
- Contexto y análisis de correlación: Los datos externos no estructurados requieren ingeniería de datos reflexiva para extraer y mantener metadatos estructurados (como fechas de creación, categorías, niveles de gravedad y tipos de servicio). Mientras que el trapo se destaca en encontrar contenido semánticamente similar, tener metadatos bien definidos permite capacidades precisas de filtrado y consulta. Por ejemplo, al analizar los problemas de rendimiento del sistema, los metadatos estructurados sobre el tiempo de incidentes, los servicios afectados y sus dependencias permiten un análisis de impacto integral a través de la consulta exacta en lugar de depender únicamente de la coincidencia semántica.
Mejora de la inscectiva de soporte de Q con AI agente
Construir sobre el Q SOLUCIÓN DE ASIGNOS DE SOPORTE (QSI) introducido en Derive ideas operativas significativas y procesables de AWS utilizando Amazon Q Businessdemostraremos cómo mejorar las capacidades analíticas a través de AI de Agentic creando complementos personalizados. Esta mejora preserva la implementación base de QSI al tiempo que agrega un procesamiento analítico preciso a través de consultas de metadatos estructurados.
Descripción general de QSI
El Solución de Insights (QSI) de Amazon Q consta de dos componentes principales:
- Recopilación de datos Tubería
- Soporte del módulo de colección utilizando AWS Lambda funciones
- Los datos de soporte consisten en casos de apoyo de AWS, eventos de salud y controles de asesores de confianza
- Amazon Eventbridge para la recopilación de datos automatizado. La tubería de datos permite dos mecanismos de sincronización:
- Actualizaciones de casos en tiempo real: Procesa los casos de soporte de AWS a través de desencadenantes basados en eventos (
CreateCase,AddCommunicationToCase,ResolveCase,ReopenCase). - Sincronización histórica y diaria: Realiza la sincronización de datos históricas iniciales y actualiza diariamente los datos del asesor de confianza AWS.
- Actualizaciones de casos en tiempo real: Procesa los casos de soporte de AWS a través de desencadenantes basados en eventos (
- Almacena datos en formato JSON en centralizado Amazon Simple Storage Service (Amazon S3) balde
- Admite la agregación de datos de múltiples cuenta a través de organizaciones de AWS
- Amazon Q Business Application Entorno
- Implementación de aplicaciones comerciales de Amazon Q
- Conector de Amazon S3 para la integración de la fuente de datos
- Configuración de la experiencia web para la interacción del usuario
- Autenticación a través de Centro de identidad de AWS IAM
Habilitar la agregación de consultas con complementos personalizados para Amazon Q Business
Los complementos personalizados extienden el negocio de Amazon Q para combinar la búsqueda semántica con capacidades de análisis precisos. Los siguientes detalles de implementación describen cómo hemos aumentado la solución QSI base:
- Aumenta el procesamiento del lenguaje natural de QSI con capacidades de consulta estructurada
- Convierte las solicitudes analíticas en precisos Amazon Athena SQL usando un Roca madre de Amazon Modelo de lenguaje grande (LLM)
- Ejecuta consultas contra tablas de metadatos estructuradas
- Proporciona resultados numéricos exactos junto con respuestas de búsqueda semántica
Procesamiento de metadatos
Para habilitar capacidades de consulta precisas, hemos implementado un marco de procesamiento de metadatos robusto que estructura e indexa los datos de soporte:
- Uso de la recopilación de datos existente de QSI en Amazon S3
- Extrae metadatos estructurados de casos de soporte en dos tablas consultables
- Mantiene campos críticos como fechas, categorías, niveles de gravedad
- Habilita las capacidades precisas de filtrado y agregación
Análisis de fuente cruzada
La solución permite un análisis integral en múltiples fuentes de datos a través de capacidades de correlación inteligente:
- Correlaciona los casos de apoyo con eventos de salud
- Habilita una evaluación operativa integral
- Admite la detección de patrones en múltiples fuentes de datos
Descripción general de la arquitectura
La siguiente ilustración muestra cómo la solución comercial mejorada de Amazon Q integra complementos personalizados con la arquitectura QSI existente. El diagrama demuestra el flujo de la consulta del usuario a través del procesamiento analítico hasta la generación de respuesta, destacando cómo la consulta de datos estructurados complementa las capacidades de búsqueda semántica basadas en RAG.
Cuando un usuario envía una consulta analítica como Show me OpenSearch case distribution based on severityocurre el siguiente proceso:
- El complemento personalizado detecta la intención analítica y desencadena una función lambda
- La función Lambda utiliza un Bedrock LLM de Amazon para transformar la consulta del lenguaje natural en Athena SQL preciso de Athena
- La consulta se ejecuta contra metadatos estructurados en Athena
- Los resultados se sintetizan nuevamente en el lenguaje natural y se presentan junto con las respuestas tradicionales del trapo
Este enfoque permite un análisis preciso mientras se mantiene la interfaz de conversación que los usuarios esperan.
Ejemplo de implementación
Aquí hay una interacción de muestra que demuestra las capacidades mejoradas. Comencemos con una consulta básica para comprender el volumen general del caso OpenSearch, utilizando consultas de datos estructuradas:
Consulta:
Respuesta:
Ahora, utilizando capacidades de RAG para analizar el contenido de casos no estructurado para ideas arquitectónicas:
Consulta:
Respuesta:
Continuar con el análisis basado en el trapo de los detalles del caso para evaluar los patrones de implementación:
Consulta:
Respuesta:
Finalmente, aquí hay otro ejemplo de análisis de datos estructurados con una consulta compleja que demuestra capacidades de agregación multidimensional:
Consulta:
Respuesta:
La respuesta combina un análisis numérico preciso con una comprensión semántica, proporcionando información procesable para las revisiones operativas.
Beneficios e impacto
Esta arquitectura del complemento ofrece varias mejoras clave:
- Análisis preciso: Recuentos y distribuciones exactas reemplazan la coincidencia semántica aproximada
- Análisis contextual: Mantiene el contexto analítico en los hilos de conversación
- Comprensión arquitectónica: Mejor correlación de problemas relacionados a través de análisis estructurado
Implementar la aplicación comercial de Amazon Q
El siguiente es un proceso de implementación simplificado. Para obtener instrucciones detalladas, consulte el Módulo de creación de aplicaciones comerciales de Amazon Q.
Requisitos previos
- AWS Cloudshell se recomienda desde entonces, viene preinstalado con las bibliotecas y herramientas requeridas. Alternativamente, puede usar una máquina local con el Interfaz de línea de comandos de AWS (AWS CLI) instalado y configurado con credenciales válidas.
- Dos cubos S3:
- Soporte de datos de datos para almacenar datos de casos de soporte de AWS
- Bucket de recursos como almacenamiento temporal para recursos Lambda para la implementación (se puede eliminar después de la implementación)
- Instancia de IAM Identity Center configurada
- La solución necesita datos de soporte de AWS recopilados utilizando el Soporte de la tubería de datos. Puede implementar ahora y agregar datos más tarde, pero la funcionalidad depende de la disponibilidad de datos en su cubo S3.
- Acceso al soneto Cloud 3-5 de Anthrope a través de Amazon Bedrock. Ver Agregue o retire el acceso a los modelos de Amazon Bedrock Foundation
- El
defaultLa base de datos debe existir en Atenea. Si no, puede crear uno usando el editor de consultas de Athena para crear la base de datos.
Pasos de implementación
Puede nosotros el siguiente script para implementar la solución Q. No se necesitan pasos manuales: el script maneja la creación y configuración de la pila automáticamente.
Limpiar
Para eliminar los recursos, elimine los cubos S3 y las pilas de CloudFormation. Elimine las pilas de CloudFormation en el siguiente orden:
case-metadata-stackamazon-q-stackcustom-plugin-stack
Tenga en cuenta que esto no eliminará los cubos S3 existentes, debe eliminar manualmente los cubos S3.
Conclusión
Al combinar la comprensión semántica de Rag con capacidades analíticas precisas a través de complementos, hemos transformado Amazon Q Business en una poderosa plataforma de análisis operativo. En los ejemplos de esta publicación, puede ver cómo las organizaciones pueden usar esta mejora para obtener ideas más precisas y procesables de sus datos de soporte de AWS, apoyando una mejor toma de decisiones operativas y una resolución de problemas proactivos. Si bien se demuestra a través del análisis de datos de soporte para mejoras operativas, estos patrones se aplican en todos los dominios que combinan fuentes de datos estructuradas y no estructuradas.
Obtenga más información
- Explorar el Documentación de Amazon Q Para comprender más sobre la construcción de complementos personalizados
- Consulte estos recursos relacionados:
Para preguntas y comentarios, visite el AWS Re: Post o contactar Soporte de AWS.
Sobre los autores
Chitresh Saxena es un especialista en AI/ML TAM especializado en soluciones generativas de IA y dedicada a ayudar a los clientes a adoptar con éxito AI/ML en AWS. Se destaca para comprender las necesidades del cliente y proporciona orientación técnica para construir, lanzar y escalar soluciones de IA que resuelven problemas comerciales complejos.
Kevin Morgan es un gerente de apoyo empresarial de Sr. en AWS que ayuda a los clientes a acelerar su viaje de adopción en la nube a través del liderazgo práctico y la orientación técnica. Como miembro de la experiencia de desarrollo de NextGen Developer TFC, se especializa en experiencia de constructor, cloudps y DevOps. Fuera del trabajo, Kevin disfruta ser un maestro de juegos para D&D y es un entusiasta de la computación retro.