Ml 16042 Image003 1260x503.jpg

Esta publicación está coescrita con Jhanvi Shriram y Ketaki Shriram de Krikey.

Krikey IA está revolucionando el mundo de la animación 3D con su innovadora plataforma que permite a cualquier persona generar animaciones 3D de alta calidad utilizando solo entradas de texto o video, sin necesidad de ninguna experiencia previa en animación. En el centro de la oferta de Krikey AI se encuentra su poderoso modelo básico entrenado para comprender el movimiento humano y traducir descripciones de texto en animaciones realistas de personajes en 3D. Sin embargo, construir un modelo de inteligencia artificial (IA) tan sofisticado requiere enormes cantidades de datos de entrenamiento de alta calidad.

Krikey AI enfrentó la difícil tarea de etiquetar una gran cantidad de datos de entrada que contenían movimientos corporales con etiquetas de texto descriptivo. Etiquetar manualmente este conjunto de datos internamente no era práctico y resultaba prohibitivamente costoso para la startup. Pero sin estas etiquetas enriquecidas, sus clientes se verían muy limitados en las animaciones que podrían generar a partir de entradas de texto.

Verdad fundamental de Amazon SageMaker es un servicio administrado por AWS que hace que sea sencillo y rentable obtener datos etiquetados de alta calidad para modelos de aprendizaje automático (ML) mediante la combinación de ML y anotaciones humanas expertas. Krikey AI utilizó SageMaker Ground Truth para acelerar el desarrollo y la implementación de su modelo de conversión de texto a animación. SageMaker Ground Truth proporcionó y administró la fuerza laboral de etiquetado, proporcionó flujos de trabajo de etiquetado de datos avanzados y flujos de trabajo automatizados para tareas humanas en el circuito, lo que permitió a Krikey AI obtener de manera eficiente etiquetas precisas adaptadas a sus necesidades.

Implementación de SageMaker Ground Truth

Como pequeña startup que trabaja para democratizar la animación 3D a través de la IA, Krikey AI enfrentó el desafío de preparar un gran conjunto de datos etiquetados para entrenar su modelo de conversión de texto a animación. Etiquetar manualmente cada entrada de datos con anotaciones descriptivas resultó increíblemente lento y poco práctico de hacer internamente a escala. Dado que la demanda de los clientes por sus servicios de animación con IA estaba creciendo rápidamente, Krikey AI necesitaba una manera de obtener rápidamente etiquetas de alta calidad en categorías amplias y diversas. No tener etiquetas y etiquetas descriptivas de alta calidad limitaría gravemente las animaciones que sus clientes podrían generar a partir de entradas de texto. La asociación con SageMaker Ground Truth proporcionó la solución, lo que permitió a Krikey AI obtener de manera eficiente etiquetas precisas adaptadas a sus necesidades.

SageMaker Ground Truth le permite configurar flujos de trabajo de etiquetado y utilizar una fuerza laboral privada o de proveedores para el etiquetado o una fuerza laboral adquirida y administrada, junto con características adicionales como flujos de trabajo de etiquetado de datos, para acelerar y optimizar aún más el proceso de etiquetado de datos. Krikey AI optó por utilizar SageMaker Ground Truth para aprovechar sus flujos de trabajo avanzados de etiquetado de datos y capacidades de etiquetado asistido por modelos, lo que simplificó y optimizó aún más su proceso de etiquetado a gran escala para entrenar sus modelos de animación de IA. Los datos fueron almacenados en Solución de almacenamiento sencilla de Amazon (Amazon S3) y Servicio de administración de claves de AWS (AWS KMS) se utilizó para la protección de datos.

El equipo de SageMaker Ground Truth proporcionó una solución de dos pasos para preparar conjuntos de datos de entrenamiento de alta calidad para el modelo de Krikey AI. Primero, el equipo desarrolló una interfaz de etiquetado personalizada adaptada a los requisitos de Krikey AI. Esta interfaz permitió a los anotadores entregar subtítulos precisos mientras mantenían altos niveles de productividad. La interfaz fácil de usar proporcionó a los anotadores varias opciones para agregar descripciones múltiples y detalladas, ayudándoles a implementar un etiquetado integral de los datos. La siguiente captura de pantalla muestra un ejemplo.

En segundo lugar, el equipo consiguió y gestionó una fuerza laboral que cumplía con los requisitos específicos de Krikey AI. Krikey AI necesitaba procesar rápidamente una gran cantidad de entradas de datos con etiquetas, etiquetas y palabras clave concisas y descriptivas en inglés. El procesamiento rápido de la gran cantidad de datos ingresados ​​permitió a Krikey AI ingresar rápidamente al mercado con su exclusiva plataforma de animación 3D.

Una parte integral de la exitosa asociación de Krikey AI con SageMaker Ground Truth fue la capacidad de revisar y perfeccionar con frecuencia el proceso de etiquetado. Krikey AI realizó llamadas semanales para examinar contenido etiquetado de muestra y brindar comentarios al equipo de SageMaker Ground Truth. Esto les permitió actualizar continuamente las pautas de lo que constituía una etiqueta descriptiva de alta calidad a medida que avanzaban en diferentes categorías. Tener esta profunda participación y capacidad para recalibrar los criterios de etiquetado fue fundamental para garantizar que se capturaran etiquetas precisas y ricas en todos sus datos, algo que Krikey AI no habría podido lograr por sí solo.

El siguiente diagrama ilustra la arquitectura de SageMaker Ground Truth.

Arquitectura general

Krikey AI creó su plataforma de animación 3D basada en IA utilizando un conjunto completo de servicios de AWS. En esencia, utilizan Solución de almacenamiento sencilla de Amazon (Amazon S3) para almacenamiento de datos, Servicio Amazon Elastic Kubernetes (Amazon EKS) para ejecutar aplicaciones en contenedores, Servicio de base de datos relacional de Amazon (Amazon RDS) para bases de datos, Amazon ElastiCache para almacenamiento en caché en memoria, y Nube informática elástica de Amazon (Amazon EC2) instancias para cargas de trabajo informáticas. Su aplicación web está desarrollada utilizando AWS amplificar. El componente crítico que permite su IA de texto a animación es SageMaker Ground Truth, que les permite etiquetar de manera eficiente un conjunto de datos de entrenamiento masivo. Esta infraestructura de AWS permite a Krikey AI ofrecer su herramienta de animación de IA directa al consumidor a clientes de todo el mundo y permite a los clientes empresariales implementar los modelos básicos de Krikey AI utilizando Inicio rápido de Amazon SageMakerademás de alojar automáticamente el editor de animación 3D sin código dentro de su propio entorno de AWS.

Resultados

La asociación de Krikey AI con SageMaker Ground Truth les permitió construir rápidamente un conjunto de datos masivo de datos de movimiento ricamente etiquetados en solo 3 meses y generar etiquetas de alta calidad para su gran conjunto de datos, lo que impulsó su conversión de texto a animación de última generación. modelo de IA, aceleró su tiempo de comercialización y ahorró más de $200 000 en costos de etiquetado.

“Amazon SageMaker Ground Truth ha cambiado las reglas del juego para Krikey AI. Su fuerza laboral calificada y sus flujos de trabajo optimizados nos permitieron etiquetar rápidamente los enormes conjuntos de datos necesarios para entrenar nuestros innovadores modelos de IA de conversión de texto a animación. Lo que a nuestro pequeño equipo le habría llevado meses, SageMaker Ground Truth nos ayudó a lograrlo en semanas: acelerar nuestra capacidad de llevar capacidades transformadoras de IA generativa a los medios, el entretenimiento, los juegos y los deportes. Con SageMaker Ground Truth como una extensión de nuestro equipo, logramos nuestro objetivo de proporcionar una herramienta de animación fácil de usar que cualquiera puede usar para animar un personaje 3D. Esto simplemente no habría sido posible sin la velocidad, la escala y el etiquetado de calidad que ofrece SageMaker Ground Truth. Fueron un verdadero multiplicador de fuerza para nuestro desarrollo de IA”.

– Dr. Ketaki Shriram, cofundador y director de tecnología de Krikey AI.

Conclusión

El ahorro de tiempo y costos, junto con el acceso a datos etiquetados de primera calidad, resalta el inmenso valor que SageMaker Ground Truth ofrece a las empresas emergentes que trabajan con IA generativa. Para obtener más información y comenzar, visite Verdad fundamental de Amazon SageMaker.

Acerca de Krikey AI

Las herramientas de animación Krikey AI permiten a cualquiera animar un personaje 3D en minutos. Las animaciones de personajes se pueden utilizar en marketing, tutoriales, juegos, películas, redes sociales, planes de lecciones y más. Además de un modelo de IA de vídeo a animación y de texto a animación, Krikey ofrece un editor 3D que los creadores pueden usar para agregar diálogos sincronizados con los labios, cambiar fondos, expresiones faciales, gestos con las manos, ángulos de cámara y más a sus vídeos animados. Las herramientas de inteligencia artificial de Krikey están disponibles en línea en www.krikey.ai hoy, en Canva Apps, Adobe Express y Mercado de AWS.


Sobre los autores

Jhanvi Shriram es la directora ejecutiva de Krikey, una startup de inteligencia artificial que cofundó con su hermana. Antes de Krikey, Jhanvi trabajó en YouTube como estratega de producción en operaciones y programas comunitarios de creadores, lo que despertó su interés en trabajar con creadores de contenido. En 2014, Jhanvi y su hermana, Ketaki Shriram, coprodujeron un largometraje que se estrenó en el Festival de Cine de Tribeca y fue adquirido por Univision. Jhanvi tiene una licenciatura y un MBA de la Universidad de Stanford y un MFA (producción cinematográfica) de la USC.

Dr. Ketaki Shriram es el CTO de Krikey, una startup de animación de IA. El editor 3D sin código de Krikey permite a cualquier persona crear contenido 3D independientemente de su experiencia. Las herramientas de Krikey se pueden utilizar para producir contenido para juegos, películas, materiales de marketing y más. La Dra. Shriram recibió su licenciatura, maestría y doctorado en el Laboratorio Virtual de Interacción Humana de Stanford. Anteriormente trabajó en Google. [x] y los laboratorios de realidad de Meta. El Dr. Shriram fue seleccionado para la clase Forbes 30 Under 30 2020 en la categoría Juegos.

Amanda Lester es un especialista sénior en comercialización en AWS y ayuda a poner la inteligencia artificial y el aprendizaje automático en manos de todos los desarrolladores e ingenieros de aprendizaje automático. Es una ejecutiva de negocios experimentada con un historial comprobado de éxito en empresas de tecnología de rápido crecimiento. Amanda tiene una amplia experiencia en liderar esfuerzos estratégicos de comercialización de tecnología de alto crecimiento. Le apasiona ayudar a acelerar el crecimiento de la comunidad tecnológica a través de programas para apoyar la igualdad de género, el emprendimiento y la educación STEM.

Yulia Rizhevsky es responsable del crecimiento y la comercialización de los servicios human-in-the-loop de AWS, y presta servicios a los clientes para crear y ajustar modelos de IA. Su equipo trabaja con clientes de AWS en la vanguardia de la IA generativa que buscan aprovechar la inteligencia humana para guiar los modelos hacia el comportamiento deseado. Antes de AWS, Julia desarrolló y lanzó productos de consumo en pagos y servicios financieros.

ami dani es gerente sénior de programas técnicos en AWS y se centra en servicios de IA/ML. Durante su carrera, se ha centrado en ofrecer proyectos de desarrollo de software transformadores para el gobierno federal y grandes empresas en industrias tan diversas como la publicidad, el entretenimiento y las finanzas. Ami tiene experiencia impulsando el crecimiento empresarial, implementando programas de capacitación innovadores y gestionando con éxito proyectos complejos y de alto impacto.