Descubra cómo Amazon Ads creó una capacidad generativa de generación de imágenes impulsada por IA utilizando Amazon SageMaker

Anuncios de Amazon ayuda a los anunciantes y las marcas a alcanzar sus objetivos comerciales mediante el desarrollo de soluciones innovadoras que llegan a millones de clientes de Amazon en cada etapa de su viaje. En Amazon Ads, creemos que lo que hace que la publicidad sea efectiva es ofrecer anuncios relevantes en el contexto correcto y en el momento correcto dentro del proceso de compra del consumidor. Con ese objetivo, Amazon Ads ha utilizado inteligencia artificial (IA), ciencia aplicada y análisis para ayudar a sus clientes a impulsar los resultados comerciales deseados durante casi dos décadas.

En una encuesta de marzo de 2023, Amazon Ads descubrió que entre los anunciantes que no pudieron crear campañas exitosas, casi el 75 por ciento citó la creación de contenido creativo como uno de sus mayores desafíos. Para ayudar a los anunciantes a abordar este desafío de manera más fluida, Amazon Ads lanzó una capacidad de generación de imágenes que desarrolla rápida y fácilmente imágenes de estilos de vida, lo que ayuda a los anunciantes a dar vida a las historias de sus marcas. Esta publicación de blog comparte más información sobre cómo las soluciones de inteligencia artificial generativa de Amazon Ads ayudan a las marcas a crear experiencias de consumo más ricas visualmente.

En esta publicación de blog, describimos los detalles arquitectónicos y operativos de cómo Amazon Ads implementó su solución de creación de imágenes generativa impulsada por IA en AWS. Antes de profundizar en la solución, comenzamos destacando la experiencia creativa de un anunciante habilitada por la IA generativa. A continuación, presentamos la arquitectura de la solución y los flujos de proceso para la creación, implementación e inferencia de modelos de aprendizaje automático (ML). Terminamos con las lecciones aprendidas.

Experiencia creativa del anunciante

Al crear creatividades publicitarias, los anunciantes prefieren personalizar la creatividad de manera que sea relevante para las audiencias deseadas. Por ejemplo, un anunciante podría tener imágenes estáticas de su producto sobre un fondo blanco. Desde el punto de vista del anunciante, el proceso se gestiona en tres pasos:

  1. La generación de imágenes convierte imágenes exclusivas de productos en imágenes ricas y contextualmente relevantes mediante IA generativa. El enfoque preserva las características originales del producto y no requiere experiencia técnica.
  2. Cualquiera que tenga acceso a la consola de Amazon Ads puede crear imágenes de marca personalizadas sin necesidad de conocimientos técnicos o de diseño.
  3. Los anunciantes pueden crear múltiples imágenes de productos atractivas y contextualmente relevantes sin costo adicional.

Un beneficio de la solución de generación de imágenes es la creación automática de imágenes de productos relevantes basándose únicamente en la selección de productos, sin necesidad de aportaciones adicionales por parte de los anunciantes. Si bien existen opciones para mejorar las imágenes de fondo, como indicaciones, temas e imágenes de productos personalizadas, no son necesarias para generar una creatividad atractiva. Si los anunciantes no proporcionan esta información, el modelo la inferirá basándose en la información de su listado de productos en amazon.com.

Figura 1. Un ejemplo de la solución de generación de imágenes que muestra un matraz hidráulico con varios fondos.

Descripción general de la solución

La Figura 2 muestra una arquitectura de solución simplificada para inferencia e implementación de modelos. Los pasos para el desarrollo y despliegue del modelo se muestran en círculos azules y se representan con números romanos (i,ii,… iv.), mientras que los pasos de inferencia están en naranja con números hindú-árabes (1,2,… 8.).

Arquitectura de la solución AWS que muestra la arquitectura de la solución Amazon Ads.

Figura 2. Arquitectura de solución para inferencia e implementación de modelos.

Amazon SageMaker está en el centro del desarrollo y despliegue del modelo. El equipo utilizó Inicio rápido de Amazon SageMaker para crear prototipos e iterar rápidamente en las condiciones deseadas (paso i). Actuando como centro modelo, JumpStart proporcionó una gran selección de modelos de cimientos y el equipo rápidamente ejecutó sus puntos de referencia en los modelos candidatos. Después de seleccionar modelos de lenguaje grande (LLM) candidatos, los equipos científicos pueden continuar con los pasos restantes agregando más personalización. Uso de los científicos aplicados de Amazon Ads Estudio SageMaker como interfaz basada en web para trabajar con SageMaker (paso ii). SageMaker tiene las políticas de acceso apropiadas para ver algunos resultados del modelo intermediario, que pueden usarse para experimentación adicional (paso iii).

El equipo de Amazon Ads revisó manualmente las imágenes a escala a través de un proceso humano en el que el equipo se aseguró de que la aplicación proporcionara imágenes responsables y de alta calidad. Para hacer eso, el equipo implementó puntos finales de prueba usando SageMaker y generó una gran cantidad de imágenes que abarcan varios escenarios y condiciones (paso iv). Aquí, Verdad fundamental de Amazon SageMaker permitió a los ingenieros de ML crear fácilmente el flujo de trabajo humano en el circuito (paso v). El flujo de trabajo permitió al equipo de Amazon Ads experimentar con diferentes modelos básicos y configuraciones mediante pruebas A/B ciegas para garantizar que la retroalimentación sobre las imágenes generadas sea imparcial. Una vez que el modelo elegido está listo para pasar a producción, el modelo se implementa (paso vi) utilizando la herramienta interna Model Lifecycle Manager del equipo. En esencia, esta herramienta utiliza artefactos generados por SageMaker (paso vii) que luego se implementa en la cuenta de producción de AWS (paso viii), utilizando SDK de SageMaker .

En cuanto a la inferencia, los clientes que utilizan Amazon Ads ahora tienen una nueva API para recibir estas imágenes generadas. El Puerta de enlace API de Amazon recibe el poner solicitud (paso 1). Luego la solicitud es procesada por AWS Lambdaque utiliza Funciones de paso de AWS para orquestar el proceso (paso 2). La imagen del producto se obtiene de un repositorio de imágenes, que forma parte de una solución existente anterior a esta función creativa. El siguiente paso es procesar las indicaciones de texto de los clientes y personalizar la imagen a través de barreras de seguridad de ingesta de contenido. Amazon comprender se utiliza para detectar contexto no deseado en el mensaje de texto, mientras que Reconocimiento de Amazon procesa imágenes para moderación de contenido propósitos (paso 3). Si las entradas pasan la inspección, entonces el texto continúa como un mensaje, mientras la imagen se procesa eliminando el fondo (paso 4). Luego, el modelo de texto a imagen implementado se utiliza para la generación de imágenes utilizando el mensaje y la imagen procesada (paso 5). Luego la imagen se carga en un depósito de Amazon Simple Storage Services (Amazon S3) para imágenes y los metadatos sobre la imagen se almacenan en una tabla de Amazon DynamoDB (paso 6). Todo este proceso a partir del paso 2 está orquestado por AWS Step Functions. Finalmente, la función Lambda recibe la imagen y los metadatos (paso 7) que luego se envían al servicio de cliente de Amazon Ads a través de API Gateway (paso 8).

Conclusión

Esta publicación presentó la solución técnica para la solución de generación de imágenes impulsada por IA de Amazon Ads, que los anunciantes pueden utilizar para crear imágenes de marca personalizadas sin necesidad de un equipo de diseño dedicado. Los anunciantes tienen una serie de funciones para generar y personalizar imágenes, como escribir mensajes de texto, seleccionar diferentes temas, intercambiar el producto destacado o cargar una nueva imagen del producto desde su dispositivo o biblioteca de activos, lo que les permite crear imágenes impactantes para publicitar sus productos. .

La arquitectura utiliza microservicios modulares con componentes separados para el desarrollo de modelos, el registro, la gestión del ciclo de vida del modelo (que es una solución basada en orquestación y funciones escalonadas para procesar las entradas de los anunciantes), seleccionar el modelo apropiado y realizar un seguimiento del trabajo durante todo el servicio y un cliente. frente a API. Aquí, Amazon SageMaker está en el centro de la solución, desde JumpStart hasta la implementación final de SageMaker.

Si planea crear su aplicación de IA generativa en Amazon SageMaker, la forma más rápida es con SageMaker JumpStart. Ver este presentación para saber cómo puede iniciar su proyecto con JumpStart.


Sobre los autores

Anita Laca es el líder de un solo subproceso de anuncios con imágenes generativas de IA en Amazon, lo que permite a los anunciantes crear anuncios visualmente impresionantes con solo hacer clic en un botón. Anita combina su amplia experiencia en la industria del hardware y el software con las últimas innovaciones en IA generativa para desarrollar soluciones eficientes y con costos optimizados para sus clientes, revolucionando la forma en que las empresas se conectan con sus audiencias. Es una apasionada de las artes visuales tradicionales y es grabadora expositora.

Burak Gozluklu es un arquitecto principal de soluciones especializado en IA/ML ubicado en Boston, MA. Ayuda a clientes estratégicos a adoptar tecnologías de AWS y específicamente soluciones de IA generativa para lograr sus objetivos comerciales. Burak tiene un doctorado en Ingeniería Aeroespacial de METU, una maestría en Ingeniería de Sistemas y un postdoctorado en dinámica de sistemas del MIT en Cambridge, MA. Burak sigue siendo un afiliado de investigación en el MIT. Burak es un apasionado del yoga y la meditación.

Cristóbal de cerveza es un ingeniero senior de desarrollo de software en Amazon ubicado en Edimburgo, Reino Unido. Con experiencia en diseño visual. Trabaja en la construcción creativa de productos para publicidad, enfocándose en la generación de videos, ayudando a los anunciantes a llegar a sus clientes a través de la comunicación visual. Crear productos que automaticen la producción creativa, utilizando técnicas tradicionales y generativas, para reducir la fricción y deleitar a los clientes. Además de su trabajo como ingeniero, a Christopher le apasiona la interacción persona-computadora (HCI) y el diseño de interfaces.

Yashal Shakti Kanungo Es científico aplicado III en Amazon Ads. Su atención se centra en modelos generativos fundamentales que toman una variedad de entradas de usuarios y generan texto, imágenes y videos. Es una combinación de investigación y ciencia aplicada, que constantemente supera los límites de lo que es posible en la IA generativa. A lo largo de los años, ha investigado e implementado una variedad de estos modelos en producción en todo el espectro de la publicidad en línea, desde el abastecimiento de anuncios, la predicción de clics, la generación de titulares, la generación de imágenes y más.

Sravan Sripada es un científico aplicado senior en Amazon ubicado en Seattle, WA. Su enfoque principal radica en desarrollar modelos de IA generativa que permitan a los anunciantes crear creatividades publicitarias atractivas (imágenes, videos, etc.) con un mínimo esfuerzo. Anteriormente, trabajó en la utilización del aprendizaje automático para prevenir fraudes y abusos en la plataforma de tiendas de Amazon. Cuando no está en el trabajo, le apasiona realizar actividades al aire libre y dedicar tiempo a la meditación.

Cathy Willcock es un Gerente Principal de Desarrollo Técnico de Negocios ubicado en Seattle, WA. Cathy lidera el equipo de cuentas técnicas de AWS que respalda la adopción de tecnologías de nube de AWS en Amazon Ads. Su equipo trabaja en Amazon Ads permitiendo el descubrimiento, las pruebas, el diseño, el análisis y la implementación de servicios de AWS a escala, con un enfoque particular en la innovación para dar forma al panorama en la industria AdTech y MarTech. Cathy ha dirigido equipos de ingeniería, productos y marketing y es inventora de las llamadas tierra-aire (1-800-RINGSKY).