Se te podría perdonar que pienses que este es el comienzo del guión de una película de ciencia ficción. “Pero no: estamos apenas en 2025 y la IA se está volviendo terriblemente buena traduciendo el inglés simple a imágenes en movimiento.
El Gen-4 acaba de lanzarse para la startup Runway. 5, y la gente está pensando dos veces con tristeza. Gen-4, según su propia publicación de lanzamiento.
5 puede producir videos cinematográficos y realistas a partir de mensajes de texto, completos con física plausible, movimiento realista y detalles visuales matizados.
Las cosas tienen peso e impulso, los objetos se mueven como deberían, los líquidos siguen su curso natural y el cabello, la tela, la iluminación, las texturas… todo se pega de un cuadro a otro.
Eso habría sido impresionante en sí mismo hace uno o dos años. ¿Pero sabes qué es realmente salvaje? Cómo Gen-4. 5 supera las pruebas de referencia contra los superteléfonos de los gigantes.
En una reciente tabla de clasificación independiente de Video-AI que lo comparó con otros sistemas de texto a video, logró con diferencia la puntuación más alta, superando a los modelos desarrollados en laboratorios mucho más grandes.
Entonces, ¿qué significa esto si eres un creativo, un narrador o simplemente alguien a quien le importa el futuro de los medios?
De repente, la creación de un cortometraje o un discurso visual (podríamos llamarlo un anuncio cinematográfico) no está limitado por las cámaras, el equipo ni el presupuesto del estudio.
Con un buen mensaje, instrucciones de iluminación y descripciones de los ángulos de la cámara, podría terminar con algo que parecería un video real.
Esa es la frontera entre el experimento amateur y la producción de nivel profesional que se está desdibujando.
Pero seamos realistas: no es perfecto. Las propias pistas admiten Gen-4. 5 todavía tropieza con el “razonamiento causal”: los efectos (y los afectos) aparecen antes que las causas (una puerta se abre antes de que alguien toque la manija), o los objetos desaparecen/nacen místicamente entre marcos.
Esto puede parecer quisquilloso, pero esos son precisamente los fallos que sirven para recordarle que se trata de medios sintéticos.
Si buscas realismo (como un cortometraje o una animación que requiere verosimilitud), tal vez esos pequeños defectos puedan distraerte de la experiencia.
Sin embargo, no puedo quitar mis ojos de este tipo de tecnología. Es como entregarle al mundo un estudio de cine de bolsillo.
Digamos que eres un estudiante y tienes una idea para una pequeña escena sorprendente de ficción especulativa: en lugar de buscar por todas partes miembros del reparto, accesorios y equipos, simplemente escribe algunos parámetros, mueve uno o dos controles deslizantes y boom: historia visual.
Para los autores independientes, para los narradores de historias de partes olvidadas del mundo, para los desvalidos, este tipo de acceso iguala enormemente el campo de juego.
Por otro lado… las compuertas se abren. Cuando cualquiera puede crear videos convincentes y de bajo costo sin capacitación ni equipo especial, ¿qué pasa con los trabajos de producción cinematográfica (con los derechos de autor) y con la “autenticidad”? ¿Y cómo podemos siquiera empezar a comprobar qué es verdad versus “IA-verdadera”?
La revolución del vídeo generado por IA no ha terminado aquí. Ya está aquí. Con Gen-4. 5, no se trata simplemente del uso de filtros inteligentes o animaciones caricaturescas.
Nos estamos acercando a contenido que, si no fuera por sus elementos visuales, podrías creer que es real. Y si eres un creador, eso es realmente emocionante… y algo aterrador.