Recientemente busqué la película más antigua que se conserva, Roundhay Garden Scene, que data de 1888. Cuatro figuras, dos hombres y dos mujeres, caminan por un patio con pasos rápidos y entrecortados. Dura unos dos segundos.
También vi recientemente algunos clips realizados en 2016 por investigadores del Instituto de Tecnología de Massachusetts y la Universidad de Maryland que se encuentran entre los primeros videos totalmente generados con inteligencia artificial. Cada uno dura aproximadamente un segundo. En uno, una figura borrosa se encuentra en un green de golf, inclinada por la cintura para hacer un putt. Nadie confundiría estos vídeos o Roundhay Garden Scene con el hábil realismo del cine contemporáneo. Y así como los escépticos a menudo se burlan del vídeo con inteligencia artificial como un desperdicio, los críticos del siglo XIX descartaron el cine temprano como una “curiosidad tonta”.
Sin embargo, un acuerdo reciente entre Disney y OpenAI ofrece un vistazo a un futuro diferente. A partir de principios de 2026, el generador de vídeos de la compañía tecnológica, Sora, podrá crear vídeos con más de 200 personajes de Disney, Marvel, Pixar y la franquicia Star Wars. Y Disney+ transmitirá una selección de clips creados por usuarios.
Sobre el apoyo al periodismo científico
Si está disfrutando de este artículo, considere apoyar nuestro periodismo galardonado suscribiéndose. Al comprar una suscripción, ayudas a garantizar el futuro de historias impactantes sobre los descubrimientos y las ideas que dan forma a nuestro mundo actual.
Disney también invertirá mil millones de dólares en OpenAI y utilizará sus herramientas para crear “nuevas experiencias para los suscriptores de Disney+”, según un comunicado de prensa conjunto de Disney y OpenAI. Al anunciar la asociación, el director ejecutivo de Disney, Robert Iger, dijo que la compañía “ampliaría de manera cuidadosa y responsable el alcance de nuestra narración a través de la IA generativa”. También dijo en una reciente conferencia telefónica sobre ganancias que tiene la intención de que los suscriptores creen contenido dentro del propio Disney+. Si quieres ver a Elsa y Cenicienta derrotar a Maléfica, podrás solicitar la escena, aunque puede que dure sólo 20 segundos.
Si este es el comienzo de AI TV on demand, me pregunto cuánto tiempo pasará hasta que estos clips alcancen los 20 minutos o una hora, dada la carga ambiental y los costos informáticos. Mucha gente cree que es imposible, pero me imagino que pocos de los que vieron Escena del jardín de Roundhay previeron El gran robo del tren, un hito de 12 minutos de la cinematografía muda de 1903, y mucho menos Lo que el viento se llevó, o el streaming.
El desafío de la generación de imágenes radica en cómo funcionan los sistemas actuales. Se basan en la difusión, una técnica que comienza con “ruido” que se refina gradualmente hasta convertirse en una imagen. Imagine una imagen de una persona parada en la niebla. Básicamente, la IA elimina la niebla y coloca nuevos píxeles en pasadas repetidas hasta que aparece una figura coherente. Cada paso para refinar una imagen generada aumenta el costo.
El vídeo es aún más desafiante. La serie de imágenes debe estar coordinada para que los rasgos faciales no cambien y las tazas de café no desaparezcan. En un segundo de vídeo de alta definición, millones de píxeles cambian. Durante un discurso de apertura en un hackathon organizado por el centro comunitario de IA AGI House, Bill Peebles, un investigador de OpenAI que ayudó a desarrollar Sora, dijo: “Descubrimos lo doloroso que es trabajar con datos de video. Hay muchos píxeles en estos videos”.
Para gestionar los píxeles, el sistema de OpenAI comprime el vídeo en una versión simplificada que guarda información crucial. Luego lo trata como una barra de pan: lo corta en cuadros que luego divide en cubos. Esto permite que el modelo coordine todos los cubos entre sí, de la misma manera que los modelos que impulsan ChatGPT relacionan todas las palabras en una respuesta.
El salto de segundos a minutos es muy agotador porque cuantos más cuadros se agregan, más información debe tener el modelo a la vista. A medida que los vídeos se hacen más largos, se acumulan inconsistencias. La verdadera IA TV “bajo demanda” también requeriría cortes entre escenas. Si todos los usuarios de Disney+ lo solicitaran con tecnología de corto plazo, los costos serían asombrosos.
Los investigadores han estado buscando enfoques más eficientes. Una es que el modelo divida el trabajo en etapas. “En lugar de eliminar el ruido o generar todo el vídeo de una vez, se genera cuadro por cuadro”, dice Tianwei Yin, científico investigador de Reve, una empresa emergente de edición de imágenes con IA, que codesarrolló el software de generación de vídeo CausVid. “En cada paso, su cómputo se limita a una porción mucho más pequeña en lugar de a todo, y esto le permite trabajar mucho más tiempo”.
Yin cree que los sistemas alcanzarán de manera más eficiente los cinco minutos de generación el próximo año y que, mediante la integración de diferentes tecnologías de IA existentes, podrían llegar a la hora poco después. Otros se han hecho eco de este optimismo. En una entrevista reciente con la BBC, el director ejecutivo de Google, Sundar Pichai, describió la posibilidad de que los estudiantes de secundaria realicen largometrajes sobre inteligencia artificial en los próximos años. Cristóbal Valenzuela, director ejecutivo de la empresa de generación de videos con inteligencia artificial Runway, dijo a El País a principios de este mes: “Tener 60 o 90 minutos con personajes e historias consistentes todavía no es posible. Pero lo será pronto”. Continuó diciendo que también está en el horizonte ver videos de IA a medida que se generan en tiempo real.
El camino desde los clips seleccionados por fans hasta los largometrajes pasará por algunas innovaciones poco glamorosas, sin mencionar las negociaciones sobre cómo pagar a los creativos cuyo trabajo lo alimenta. Y aunque la carga financiera de los vídeos de IA parece prohibitiva, millones de personas en todo el mundo participan en la producción y el entrenamiento de modelos de IA, y los costos de las tecnologías suelen disminuir. Por ejemplo, el ancho de banda era prohibitivamente caro en 1998 (costaba alrededor de 1.200 dólares por megabit por segundo (Mbps) mensual para redes grandes), pero en 2025 el coste más bajo informado fue de 0,05 dólares por Mbps mensual, una disminución del 99,996 por ciento. Este cambio hizo posible la transmisión en Disney+ o Netflix.
El camino cultural de los nuevos medios es mucho más difícil de imaginar y la resistencia suele ser intensa. El poeta Charles Baudelaire arremetió contra la fotografía en 1859 por su perezoso realismo que alejaba el arte de la imaginación. En siglos pasados, “tanto los escépticos como los partidarios compararon la fotografía con la pintura y las imágenes en movimiento con el teatro”, escribió el actual estudioso Reuben de Lautour. Parece que estamos en un momento aún más complicado. Lo que parece seguro es que, como en el pasado, la tecnología evolucionará rápidamente, permitiendo a millones de creadores probar posibilidades que aún no podemos predecir.
Es hora de defender la ciencia
Si te ha gustado este artículo, me gustaría pedirte tu apoyo. Científico americano ha servido como defensor de la ciencia y la industria durante 180 años, y ahora mismo puede ser el momento más crítico en esos dos siglos de historia.
he sido un Científico americano suscriptor desde que tenía 12 años y me ayudó a moldear mi forma de ver el mundo. Ciencia-Am Siempre me educa y me deleita, e inspira una sensación de asombro por nuestro vasto y hermoso universo. Espero que también lo haga por ti.
Si te suscribes a Científico americanousted ayuda a garantizar que nuestra cobertura se centre en investigaciones y descubrimientos significativos; que tenemos los recursos para informar sobre las decisiones que amenazan a los laboratorios en todo Estados Unidos; y que apoyemos a los científicos tanto en ciernes como en activo en un momento en el que con demasiada frecuencia el valor de la ciencia misma pasa desapercibido.
A cambio, obtiene noticias esenciales, podcasts cautivadores, infografías brillantes, boletines informativos imperdibles, vídeos imprescindibles, juegos desafiantes y los mejores escritos e informes del mundo científico. Incluso puedes regalarle a alguien una suscripción.
Nunca ha habido un momento más importante para que nos levantemos y demostremos por qué la ciencia es importante. Espero que nos apoyes en esa misión.