A medida que la generación de imágenes de IA se vuelve cada vez más central para los flujos de trabajo comerciales modernos, las organizaciones buscan formas prácticas de implementar esta tecnología para desafíos específicos de la industria. Aunque el potencial de la generación de imágenes de IA es vasto, muchas empresas luchan por aplicarlo de manera efectiva a sus casos de uso únicos.
En esta publicación, exploramos cómo Canvas de Amazon Nova Puede resolver los desafíos comerciales del mundo real a través de técnicas avanzadas de generación de imágenes. Nos centramos en dos casos de uso específicos que demuestran la potencia y la flexibilidad de esta tecnología:
- Diseño interior – El acondicionamiento de la imagen con segmentación ayuda a los diseñadores de interiores a iterar rápidamente a través de conceptos de diseño, reduciendo drásticamente el tiempo y el costo asociados con la creación de presentaciones del cliente.
- Fotografía de productos – La superación permite a los fotógrafos de productos crear diversos contextos ambientales para productos sin sesiones de fotos extensas
Ya sea que sea una empresa de diseño de interiores que busque optimizar su proceso de visualización o un negocio minorista con el objetivo de reducir los costos de fotografía, esta publicación puede ayudarlo a utilizar las características avanzadas de Amazon Nova Canvas para lograr sus objetivos comerciales específicos. Vamos a sumergirnos en cómo estas poderosas herramientas pueden transformar su flujo de trabajo de generación de imágenes.
Requisitos previos
Debe tener los siguientes requisitos previos:
Diseño interior
Una empresa de diseño de interiores tiene el siguiente problema: sus diseñadores pasan horas creando diseños fotorrealistas para presentaciones de clientes, lo que necesita múltiples iteraciones de la misma habitación con diferentes temas y elementos decorativos. La representación 3D tradicional lleva mucho tiempo y costoso. Para resolver este problema, puede usar las características de acondicionamiento de imágenes (segmentación) de Amazon Nova Canvas para iterar rápidamente en las fotos de la habitación existentes. La imagen de condición se analiza para identificar formas de contenido prominentes, lo que resulta en una máscara de segmentación que guía la generación. La imagen generada sigue de cerca el diseño de la imagen de la condición al tiempo que permite que el modelo tenga libertad creativa dentro de los límites de cada área de contenido.
Las siguientes imágenes muestran ejemplos de la entrada inicial, una máscara de segmentación basada en la entrada y la salida basada en dos indicaciones diferentes.
| Imagen de entrada de una sala de estar | Máscara de segmentación de la sala de estar |
| Aviso: una sala de estar minimalista | Aviso: una sala de estar con temas de playa costera |
Esta publicación demuestra cómo mantener la integridad estructural mientras se transforma los elementos interiores, por lo que puede generar múltiples variaciones en minutos con imágenes simples de solicitación y entrada. El siguiente bloque de código presenta la estructura de solicitud de API para el acondicionamiento de la imagen con segmentación. Los parámetros para realizar estas transformaciones se pasan al modelo a través de la solicitud API. Asegúrese de que la imagen de salida tenga las mismas dimensiones que la imagen de entrada para evitar resultados distorsionados.
El taskType El objeto determina el tipo de operación que se realiza y tiene su propio conjunto de parámetros, y el imageGenerationConfig El objeto contiene parámetros generales comunes a todos los tipos de tareas (excepto la eliminación de antecedentes). Para obtener más información sobre la estructura de solicitud/respuesta para diferentes tipos de generaciones, consulte Estructura de solicitud y respuesta para la generación de imágenes.
El siguiente código Python demuestra una generación de acondicionamiento de imagen invocando el modelo Amazon Nova Canvas V1.0 en Amazon Bedrock:
Fotografía de productos
Una compañía de calzado deportivo tiene el siguiente problema: necesita mostrar sus nuevas zapatillas versátiles en múltiples entornos (pista de atletismo, aire libre y más), que requieren costosas sesiones de ubicación y múltiples sesiones de fotografía para cada variante. Para resolver este problema, puede usar el lienzo de Amazon Nova para generar diversas tomas a partir de una sola foto de producto. La superación se puede usar para reemplazar el fondo de una imagen. Puede instruir al modelo para preservar partes de la imagen proporcionando un mensaje de máscara, por ejemplo, “zapatos”. Un mensaje de máscara es una descripción del lenguaje natural de los objetos en su imagen que no debe cambiarse durante la superación. Luego puede generar los zapatos en diferentes fondos con nuevas indicaciones.
Las siguientes imágenes muestran ejemplos de la entrada inicial, una máscara creada para “zapatos” y salida basadas en dos indicaciones diferentes.
En lugar de usar un mensaje de máscara, puede ingresar una imagen de máscara, que define las áreas de la imagen para preservar. La imagen de la máscara debe ser del mismo tamaño que la imagen de entrada. Las áreas a editar están sombreadas de blanco puro y las áreas para preservar están sombreadas de negro puro. El modo de extracción es un parámetro para definir cómo se trata la máscara. Usar DEFAULT a la transición suavemente entre el área enmascarada y el área no masticada. Este modo es generalmente mejor cuando desea que el nuevo fondo use colores similares al fondo original. Sin embargo, puede obtener un efecto de halo si su aviso requiere un nuevo fondo que sea significativamente diferente al fondo original. Usar PRECISE para adherirse estrictamente a los límites de la máscara. Este modo es generalmente mejor cuando está haciendo cambios significativos en el fondo.
Esta publicación demuestra cómo usar la superación para capturar la precisión del producto, y luego convertir una foto de estudio en diferentes entornos sin problemas. El siguiente código ilustra la estructura de solicitud de API para la superación:
El siguiente código de Python demuestra un reemplazo de fondo basado en desacuerdo invocando el modelo Amazon Nova Canvas V1.0 en Amazon Bedrock. Para más ejemplos de código, ver Ejemplos de código.
Limpiar
Cuando haya terminado de probar esta solución, limpie sus recursos para evitar que se incurran en los cargos de AWS:
- Realice una copia de seguridad de los cuadernos Jupyter en la instancia de cuaderno de Sagemaker.
- Apague y elimine la instancia del cuaderno de Sagemaker.
Consideraciones de costos
Considere los siguientes costos de la solución implementada en AWS:
- Incurrirá en cargos por inferencia generativa de IA en Amazon Bedrock. Para más detalles, consulte Precio de roca madre de Amazon.
- Incurrirá en cargos para su instancia de cuaderno de Sagemaker. Para más detalles, consulte Precios de Amazon Sagemaker.
Conclusión
En esta publicación, exploramos implementaciones prácticas de Amazon Nova Canvas para dos escenarios comerciales de alto impacto. Ahora puede generar múltiples variaciones de diseño o entornos diversos en minutos en lugar de horas. Con el lienzo de Amazon Nova, puede reducir significativamente los costos asociados con la creación tradicional de contenido visual. Referirse a Generando imágenes con Amazon Nova Para conocer las otras capacidades respaldadas por Amazon Nova Canvas.
Como próximos pasos, comience con un solo caso de uso que coincida estrechamente con las necesidades de su negocio. Use nuestros ejemplos de código proporcionados como base y adaptarlos a sus requisitos específicos. Después de estar familiarizado con las implementaciones básicas, explore la combinación de múltiples técnicas y escala gradualmente. No olvide rastrear el ahorro de tiempo y las reducciones de costos para medir el ROI. Póngase en contacto con su equipo de cuenta de AWS para obtener la guía de implementación empresarial.
Sobre el autor
Arjun Singh es un científico de datos Sr. en Amazon, experimentado en inteligencia artificial, aprendizaje automático e inteligencia empresarial. Es una persona visual y es muy curiosa sobre las tecnologías generativas de IA en la creación de contenido. Él colabora con los clientes para construir soluciones ML/AI para lograr los resultados deseados. Se graduó con una maestría en sistemas de información de la Universidad de Cincinnati. Fuera del trabajo, le gusta jugar al tenis, hacer ejercicio y aprender nuevas habilidades.