Presentamos Stable Diffusion 3.5 Large en Amazon SageMaker JumpStart

Nos complace anunciar la disponibilidad de IA de estabilidad El último y más avanzado modelo de conversión de texto a imagen, Stable Diffusion 3.5 Large, en Inicio rápido de Amazon SageMaker. Este nuevo modelo de generación de imágenes de vanguardia, que fue entrenado en HiperPod de Amazon SageMakerpermite a los clientes de AWS generar imágenes de alta calidad a partir de descripciones de texto con una facilidad, flexibilidad y potencial creativo sin precedentes. Al agregar Stable Diffusion 3.5 Large a SageMaker JumpStart, estamos dando otro paso significativo hacia democratizar el acceso a tecnologías avanzadas de IA y permitir que empresas de todos los tamaños aprovechen el poder de la IA generativa.

En esta publicación, proporcionamos una guía de implementación para suscribirse a Stable Diffusion 3.5 Large en SageMaker JumpStart, implementando el modelo en Amazon SageMaker Estudioy generar imágenes mediante mensajes de texto a imagen.

Stable Diffusion 3.5 Grandes capacidades y casos de uso

Con 8.100 millones de parámetros, una calidad superior y un rápido cumplimiento, Stable Diffusion 3.5 Large es el modelo más potente de la familia Stable Diffusion. El modelo se destaca en la creación de imágenes diversas y de alta calidad en una amplia gama de estilos, lo que lo convierte en una excelente herramienta para medios, juegos, publicidad, comercio electrónico, capacitación corporativa, venta minorista y educación. Para la generación de ideas, Stable Diffusion 3.5 Large puede acelerar la creación de guiones gráficos, la creación de arte conceptual y la creación rápida de prototipos de efectos visuales. Para la producción, puede generar rápidamente imágenes de 1 megapíxel de alta calidad para campañas, publicaciones en redes sociales y anuncios, ahorrando tiempo y recursos mientras mantiene el control creativo.

Stable Diffusion 3.5 Large ofrece a los usuarios posibilidades creativas casi infinitas, que incluyen:

  • Creatividad y fotorrealismo mejorados. – Puede generar imágenes excepcionales con imágenes 3D muy detalladas que incluyen detalles finos como iluminación y texturas.
  • Excepcional dominio de múltiples materias – Ofrece capacidades incomparables para generar imágenes con múltiples sujetos, lo que es ideal para crear escenas complejas.
  • Mayor eficiencia – La producción de contenidos rápida, precisa y de calidad agiliza las operaciones, ahorrando tiempo y dinero. A pesar de su potencia y complejidad, Stable Diffusion 3.5 Large está optimizado para la eficiencia, brindando accesibilidad y facilidad de uso para una amplia audiencia.

Descripción general de la solución

Con SageMaker JumpStart, puede elegir entre una amplia selección de modelos de cimentación (FM) disponibles públicamente. Los profesionales de ML pueden implementar FM en instancias dedicadas de SageMaker desde un entorno aislado de red y personalizar modelos usando Amazon SageMaker para entrenamiento e implementación de modelos. Ahora puede descubrir e implementar el modelo grande de Stable Diffusion 3.5 con unos pocos clics en SageMaker Studio o mediante programación a través del SDK de Python de SageMaker, lo que le permite derivar el rendimiento del modelo y los controles MLOps con funciones de SageMaker como Canalizaciones de Amazon SageMaker, Depurador de Amazon SageMakero registros de contenedor. El modelo se implementa en un entorno seguro de AWS y bajo los controles de su nube privada virtual (VPC), lo que ayuda a brindar seguridad de los datos.

El modelo Stable Diffusion 3.5 Large está disponible hoy en las siguientes regiones de AWS: EE. UU. Este (Norte de Virginia, Ohio), EE. UU. Oeste (Oregón), Asia Pacífico (Osaka, Hong Kong), China (Beijing), Medio Oriente (Bahrein) , África (Ciudad del Cabo) y Europa (Milán, Estocolmo).

SageMaker Studio es un entorno de desarrollo integrado (IDE) que proporciona una única interfaz visual basada en web donde puede acceder a herramientas diseñadas específicamente para realizar todos los pasos de desarrollo del aprendizaje automático (ML), desde la preparación de datos hasta la creación, el entrenamiento y la implementación de su ML. modelos. Para obtener más detalles sobre cómo comenzar y configurar SageMaker Studio, consulte Amazon SageMaker Estudio.

Requisitos previos

Asegúrate de que tu Gestión de acceso e identidad de AWS (IAM) el rol tiene AmazonSageMakerFullAccess. Para implementar correctamente el modelo, confirme que su función de IAM tenga los siguientes tres permisos y que tenga autoridad para realizar suscripciones a AWS Marketplace en la cuenta de AWS utilizada:

  • aws-marketplace:ViewSubscriptions
  • aws-marketplace:Unsubscribe
  • aws-marketplace:Subscribe

Suscríbase al paquete de modelo Stable Diffusion 3.5 Large

Puede acceder a SageMaker JumpStart a través de la página de inicio de SageMaker Studio seleccionando JumpStart en la sección Soluciones automatizadas y prediseñadas. La página de inicio de JumpStart le permite explorar varios recursos, incluidas soluciones, modelos y cuadernos. Puede buscar un proveedor en particular. En la siguiente captura de pantalla, vemos todos los modelos de Stability AI en SageMaker JumpStart.

Cada modelo se presenta con una tarjeta de modelo que contiene información clave como el nombre del modelo, la capacidad de ajuste, el proveedor y una breve descripción. para encontrar el Difusión estable 3.5L modelo, puede explorar el carrusel Foundation Model: Image Generation o utilizar la función de búsqueda. Seleccione Difusión estable 3.5 grande.

A continuación, nos suscribiremos a Stable Diffusion 3.5 Large, siga estos pasos:

  1. Abra la página de listado de modelos en Mercado de AWS utilizando el enlace disponible en el cuaderno de ejemplo en SageMaker JumpStart.
  2. En el listado, elija Continuar suscribiéndote.
  3. en el Suscríbete a este software página, revisar y elegir Aceptar oferta si usted y su organización aceptan el CLUF, los precios y los términos de soporte.
  4. Elegir Continuar a la configuración para comenzar a configurar su modelo.
  5. Elija una región admitida y verá el nombre de recurso de Amazon (ARN) del paquete modelo que debe especificar al crear un punto final.

Nota: Si no tiene los permisos necesarios para ver o suscribirse al modelo, comuníquese con su administrador de AWS o punto de contacto de adquisiciones. Muchas empresas pueden limitar los permisos de AWS Marketplace para controlar las acciones que alguien puede realizar en el Portal de administración de AWS Marketplace.

Implementar el modelo en SageMaker Studio

Ahora está preparado para seguir el ejemplo del cuaderno de Stability AI. repositorio de GitHub para crear un punto final (con el paquete modelo ARN de AWS Marketplace) y crear un punto de enlace implementable ModelPackage.

Para Stable Diffusion 3.5 Large, deberá implementar en un Nube informática elástica de Amazon (Amazon EC2) instancia ml.p5.48xlarge.

Generar imágenes con un mensaje de texto

Consulte el Difusión estable 3.5 Documentación grande para más detalles. Del cuaderno de ejemplo, el código para generar una imagen es el siguiente:

sm_runtime = boto3.client("sagemaker-runtime")

params = {
    "prompt": " Photography, pink rose flowers in the twilight, glowing, tile houses in the background.",
    "seed": 101,
    "aspect_ratio": "21:9",
    "output_format": "jpeg",
}

payload = json.dumps(params).encode("utf-8")

response = sm_runtime.invoke_endpoint(
    EndpointName=endpoint_name,
    ContentType="application/json",
    Accept="application/json",
    Body=payload,
)

out = json.loads(response["Body"].read().decode("utf-8"))
try:
    base64_string = out["body"]["images"][0]
    image_data = base64.b64decode(base64_string)
    image = Image.open(io.BytesIO(image_data))
    display(image)

except:
    print(out)

Los siguientes son ejemplos de imágenes generadas a partir de diferentes mensajes.

Inmediato:

Fotografía, flores rosadas en el crepúsculo, casas de tejas brillantes al fondo.

Inmediato:

La palabra “AWS x Stability” en una escritura gruesa en bloques rodeada de raíces y enredaderas sobre un fondo blanco sólido. La escena está iluminada por una luz plana, creando una escena reflectante con una paleta de colores mínima. Estilo quilling.

Inmediato:

Pintura expresionista, perfil lateral de la silueta de un estudiante sentado en un escritorio, absorto en la lectura de un libro. Sus pensamientos se conectan artísticamente con las estrellas y el vasto universo, simbolizando la expansión del conocimiento y una mente ilimitada.

Inmediato:

Escena callejera llena de energía en un callejón de Tokio iluminado con luces de neón por la noche, donde sale vapor de los carritos de comida y coloridos letreros de neón iluminan el pavimento resbaladizo por la lluvia.

Inmediato:

Escena de animación 3D de un aventurero viajando por el mundo con su perro mascota.

Limpiar

Cuando haya terminado de trabajar, puede eliminar el punto final para liberar las instancias EC2 asociadas a él y dejar de facturar.

Obtenga su lista de puntos finales de SageMaker usando el Interfaz de línea de comandos de AWS (AWS CLI) de la siguiente manera:

!aws sagemaker list-endpoints

Luego elimine los puntos finales:

deployed_model.sagemaker_session.delete_endpoint(endpoint_name)

Conclusión

En esta publicación, explicamos la suscripción a Stable Diffusion 3.5 Large en SageMaker JumpStart, la implementación del modelo en SageMaker Studio y la generación de una variedad de imágenes con el último modelo de texto a imagen de Stability AI.

Comience a crear imágenes asombrosas hoy con Stable Diffusion 3.5 Large en SageMaker JumpStart. Para obtener más información sobre SageMaker JumpStart, consulte Modelos preentrenados de SageMaker JumpStart, Modelos de base JumpStart de Amazon SageMakery Introducción a Amazon SageMaker JumpStart.

Si desea explorar técnicas avanzadas de ingeniería rápida que pueden mejorar el rendimiento de los modelos de texto a imagen de Stability AI y facilitar la creación de imágenes atractivas, consulte Comprender la ingeniería rápida: desbloquear el potencial creativo de los modelos de estabilidad AI en AWS.


Acerca de los autores

Tom Yemington es un especialista sénior en modelos GenAI centrado en ayudar a los proveedores y clientes de modelos a escalar soluciones de IA generativa en AWS. Tom es un profesional certificado en seguridad de sistemas de información (CISSP). Fuera del trabajo, puedes encontrar a Tom compitiendo con autos antiguos o enseñando a la gente a correr como instructor en eventos del día de la pista.

Isha Dua es un arquitecto de soluciones senior con sede en el área de la bahía de San Francisco que trabaja con proveedores de modelos GENAI y ayuda a los clientes a optimizar sus cargas de trabajo GENAI en AWS. Ayuda a los clientes empresariales a crecer entendiendo sus objetivos y desafíos, y los guía sobre cómo pueden diseñar sus aplicaciones de forma nativa en la nube, garantizando al mismo tiempo la resiliencia y la escalabilidad. Le apasionan las tecnologías de aprendizaje automático y la sostenibilidad ambiental.

Boshi Huang es científico aplicado sénior en IA generativa en Amazon Web Services, donde colabora con clientes para desarrollar e implementar soluciones de IA generativa. La investigación de Boshi se centra en avanzar en el campo de la IA generativa a través de ingeniería automática, mecanismos de defensa y ataque adversario, aceleración de inferencias y el desarrollo de métodos para la generación de contenido visual responsable y confiable.