Amalyze Security Findings.jpg

Los datos son la base para capturar el máximo valor de la tecnología de inteligencia artificial y resolver rápidamente los problemas comerciales. Sin embargo, para desbloquear el potencial de las tecnologías de IA generativa, existe un requisito previo clave: sus datos deben estar preparados adecuadamente. En esta publicación, describimos cómo usar la IA generativa para actualizar y escalar su canal de datos usando Lienzo de Amazon SageMaker para la preparación de datos.

Por lo general, el trabajo de canalización de datos requiere una habilidad especializada para preparar y organizar datos para que los analistas de seguridad los utilicen para extraer valor, lo que puede llevar tiempo, aumentar los riesgos y aumentar el tiempo de obtención de valor. Con SageMaker Canvas, los analistas de seguridad pueden acceder de forma segura y sin esfuerzo a modelos básicos líderes para preparar sus datos más rápido y remediar los riesgos de seguridad cibernética.

La preparación de datos implica un formato cuidadoso y una contextualización reflexiva, partiendo del problema del cliente. Ahora, con el chat de SageMaker Canvas para la capacidad de preparación de datos, los analistas con conocimiento del dominio pueden preparar, organizar y extraer valor de los datos rápidamente mediante una experiencia basada en chat.

Descripción general de la solución

La IA generativa está revolucionando el ámbito de la seguridad al brindar experiencias de lenguaje natural y personalizadas, mejorar la identificación de riesgos y las soluciones, al tiempo que aumenta la productividad empresarial. Para este caso de uso, utilizamos SageMaker Canvas, Controlador de datos de Amazon SageMaker, Lago de seguridad del Amazonasy Servicio de almacenamiento simple de Amazon (Amazon S3). Amazon Security Lake le permite agregar y normalizar datos de seguridad para analizarlos y obtener una mejor comprensión de la seguridad en toda su organización. Amazon S3 le permite almacenar y recuperar cualquier cantidad de datos en cualquier momento y lugar. Ofrece escalabilidad, disponibilidad de datos, seguridad y rendimiento líderes en la industria.

SageMaker Canvas ahora admite capacidades integrales de preparación de datos impulsadas por SageMaker Data Wrangler. Con esta integración, SageMaker Canvas proporciona un espacio de trabajo sin código de extremo a extremo para preparar datos, crear y utilizar el aprendizaje automático (ML) y Roca Amazónica modelos básicos para acelerar el paso de los datos a la información empresarial. Ahora puede descubrir y agregar datos de más de 50 fuentes de datos y explorar y preparar datos utilizando más de 300 análisis y transformaciones integrados en la interfaz visual de SageMaker Canvas. También verá un rendimiento más rápido para transformaciones y análisis, y se beneficiará de una interfaz de lenguaje natural para explorar y transformar datos para ML.

En esta publicación, demostramos tres transformaciones clave; filtrado, cambio de nombre de columnas y extracción de texto de una columna en el conjunto de datos de hallazgos de seguridad. También demostramos el uso de la función de chat para preparación de datos en SageMaker Canvas para analizar los datos y visualizar sus hallazgos.

Requisitos previos

Antes de comenzar, necesita una cuenta de AWS. También es necesario configurar un Amazon SageMaker Estudio dominio. Para obtener instrucciones sobre cómo configurar SageMaker Canvas, consulte Genere predicciones de aprendizaje automático sin código.

Acceda a la interfaz de chat de SageMaker Canvas

Complete los siguientes pasos para comenzar a utilizar la función de chat de SageMaker Canvas:

  1. En la consola de SageMaker Canvas, elija Controlador de datos.
  2. Bajo Conjuntos de datoselija Amazon S3 como origen y especifique el conjunto de datos de hallazgos de seguridad del lago de seguridad de Amazon.
  3. Elige tu flujo de datos y elige Chat para preparación de datosque mostrará una experiencia de interfaz de chat con indicaciones guiadas.

Filtrar datos

Para esta publicación, primero queremos filtrar las advertencias críticas y de alta gravedad, por lo que ingresamos en el cuadro de chat instrucciones para eliminar hallazgos que no sean críticos o de alta gravedad. Canvas elimina las filas, muestra una vista previa de los datos transformados y brinda la opción de usar el código. Podemos agregarlo a la lista de pasos en el Pasos cristal.

Cambiar el nombre de las columnas

A continuación, queremos cambiar el nombre de dos columnas, por lo que ingresamos en el cuadro de chat el siguiente mensaje para cambiar el nombre de las desc y título columnas para Hallazgo y Remediación. SageMaker Canvas genera una vista previa y, si está satisfecho con los resultados, puede agregar los datos transformados a los pasos del flujo de datos.

Extraer texto

Para determinar las regiones de origen de los hallazgos, puede ingresar instrucciones en el chat para Extraiga el texto de la región de la columna UID según el patrón arn:aws:security:securityhub:region:* y crea una nueva columna llamada Región) para extraer el texto de la región de la columna UID según un patrón. Luego, SageMaker Canvas genera código para crear una nueva columna de región. La vista previa de datos muestra que los hallazgos se originan en una región: us-west-2. Puede agregar esta transformación al flujo de datos para el análisis posterior.

Analizar los datos

Finalmente, queremos analizar los datos para determinar si existe una correlación entre la hora del día y la cantidad de hallazgos críticos. Puede ingresar una solicitud para resumir los hallazgos críticos por hora del día en el chat, y SageMaker Canvas le brindará información útil para su investigación y análisis.

Visualizar hallazgos

A continuación, visualizamos los hallazgos por gravedad a lo largo del tiempo para incluirlos en un informe de liderazgo. Puede pedirle a SageMaker Canvas que genere un gráfico de barras de gravedad en comparación con la hora del día. En segundos, SageMaker Canvas creó el gráfico agrupado por gravedad. Puede agregar esta visualización al análisis en el flujo de datos y descargarla para su informe. Los datos muestran que los hallazgos se originan en una región y ocurren en momentos específicos. Esto nos da confianza sobre dónde centrar nuestra investigación de hallazgos de seguridad para determinar las causas fundamentales y las acciones correctivas.

Limpiar

Para evitar incurrir en cargos no deseados, complete los siguientes pasos para limpiar sus recursos:

  1. Vacíe el depósito S3 que utilizó como fuente.
  2. Cierre sesión en SageMaker Canvas.

Conclusión

En esta publicación, le mostramos cómo utilizar SageMaker Canvas como un espacio de trabajo sin código de extremo a extremo para la preparación de datos con el fin de crear y utilizar modelos básicos de Amazon Bedrock para acelerar el tiempo de recopilación de información empresarial a partir de los datos.

Tenga en cuenta que este enfoque no se limita a los hallazgos de seguridad; Puede aplicar esto a cualquier caso de uso de IA generativa que utilice la preparación de datos como elemento central.

El futuro pertenece a las empresas que puedan aprovechar eficazmente el poder de la IA generativa y los grandes modelos lingüísticos. Pero para hacerlo, primero debemos desarrollar una estrategia de datos sólida y comprender el arte de la preparación de datos. Al utilizar IA generativa para estructurar nuestros datos de manera inteligente y trabajar hacia atrás desde el cliente, podemos resolver los problemas comerciales más rápido. Con el chat de SageMaker Canvas para la preparación de datos, a los analistas les resultará sencillo comenzar y capturar valor inmediato de la IA.


Sobre los autores

Sudeesh Sasidharan es Arquitecto de Soluciones Senior en AWS, dentro del equipo de Energía. A Sudeesh le encanta experimentar con nuevas tecnologías y crear soluciones innovadoras que resuelvan desafíos comerciales complejos. Cuando no está diseñando soluciones o jugando con las últimas tecnologías, puedes encontrarlo en la cancha de tenis trabajando su revés.

John Klacynski es gerente principal de soluciones para el cliente dentro del equipo de proveedores de software independientes (ISV) de AWS. En este puesto, ayuda mediante programación a los clientes ISV a adoptar tecnologías y servicios de AWS para alcanzar sus objetivos comerciales más rápidamente. Antes de unirse a AWS, John dirigió equipos de productos de datos para grandes empresas de bienes de consumo empaquetados, ayudándolas a aprovechar la información valiosa sobre los datos para mejorar sus operaciones y la toma de decisiones.