Openai lanzó Sora 2, un modelo de texto a video y audio centrado en la plausibilidad física, la capacidad de control múltiple y el diálogo sincronizado/SFX. El equipo de Operai también ha lanzado una nueva aplicación Sora iOS de invitación (EE. UU. Y Canadá primero) que permite la creación social, la remezcla y los “cameos” controlados por el consentimiento para insertar una imagen verificada en escenas generadas.
Capacidades de modelo
Sora 2 afirma que el modelado mundial materialmente mejor (por ejemplo, los rebotes en tomas perdidas en lugar de la “teletransportación” de los objetos) mantienen el estado en los disparos para ediciones de seguimiento de instrucciones y genera audio nativo y alineado en el tiempo (habla, ambiente, efectos). Estos se enmarcan como requisitos previos para la generación de videos de grado de simulación en lugar de la síntesis de “mejor esfuerzo” de clips.
Arquitectura de aplicaciones y “cameos”
La aplicación Sora se basa en cameos: los usuarios registran un breve video+audio en la aplicación para verificar la identidad y capturar la imagen; Los propietarios de cameos controlan quién puede usar su semejanza y puede revocar o eliminar cualquier video, incluidos borradores, que los incluyen. La aplicación está disponible en dispositivos iOS y se expandirá después del lanzamiento de EE. UU./Canadá.
Postura de seguridad
Sora 2 de OpenAI documenta un despliegue iterativo con restricciones específicas de tiempo de lanzamiento y controles de procedencia:
Cargas/generaciones: en el lanzamiento, OpenAI está restringiendo el uso de cargas de imágenes que cuentan con una persona fotorrealista y todas las cargas de video. Sora 2 no es compatible con el video a video en el lanzamiento, bloquea el texto a video de las figuras públicas y las generaciones bloquean que incluyen personas reales, excepto cuando un usuario ha optado a través de la función de cameo. Se aplican umbrales de clasificadores adicionales cuando aparece una persona real. Procedencia: todas las salidas llevan metadatos C2PA y una marca de agua en movimiento visible en las descargas, con herramientas de detección interna para la evaluación de origen.
Controles parentales
Paralelamente a Sora, OpenAi introdujo controles parentales integrados a través de ChatGPT: los padres pueden optar a los adolescentes en un alimento no personalizado, administrar los permisos de DM y controlar si se permite el desplazamiento continuo, alineado con la filosofía de “creación-sobre-consumo de creación” del alimento SORA.
Acceso y precios
La aplicación Sora iOS está disponible para descargar ahora; El acceso se abre por invitación, con Sora 2 inicialmente libre bajo límites limitados con calculación. Los usuarios de ChatGPT Pro obtienen acceso a un nivel experimental de Sora 2 Pro en Sora.com (y llegando a la aplicación). El acceso a la API se planifica después del lanzamiento del consumidor. El contenido turbo Sora 1 existente permanece disponible en las bibliotecas de usuarios.
Resumen
Sora 2 empuja el texto a video hacia la generación controlable, que respeta la física y sincronizada de audio, y OpenAI lo envía dentro de una aplicación iOS solo por invitación con cameos controlados por consentimiento más metadatos C2PA y marcas de agua visibles para la provisión. El despliegue inicial de EE. UU./Canadá prioriza las limitaciones de seguridad (por ejemplo, restricciones en las representaciones de figura pública) mientras organiza un acceso más amplio y planes de API, lo que indica un cambio deliberado de demostraciones de capacidad sin procesar a herramientas de medios de producción gobernadas.
Michal Sutter es un profesional de la ciencia de datos con una Maestría en Ciencias en Ciencias de Datos de la Universidad de Padova. Con una base sólida en análisis estadístico, aprendizaje automático e ingeniería de datos, Michal se destaca por transformar conjuntos de datos complejos en ideas procesables.
🔥[Recommended Read] NVIDIA AI Open-Sources Vipe (motor de pose de video): una herramienta de anotación de video 3D potente y versátil para AI espacial