Se está produciendo un cambio radical en el debate global sobre la IA, y está ocurriendo precisamente en el Reino Unido. Pero no de una manera sutil, ni mucho menos. Los miembros del Parlamento finalmente están rechazando uno de los pasatiempos más queridos de la industria tecnológica: ejecutar algoritmos de inteligencia artificial en grandes cantidades de contenido en línea sin mucha consideración por quién es realmente el propietario.
Su solución es sencilla, casi obvia. Si un modelo de IA se entrena con el contenido de alguien, probablemente debería pagar por ello.
Por el momento, un comité parlamentario del Reino Unido está pidiendo al gobierno que implemente lo que llama un modelo de “primero las licencias”. Eso significaría que las empresas necesitarían permiso antes de poder utilizar obras protegidas por derechos de autor para entrenar modelos de IA. Esto incluye desde libros y periodismo hasta música, arte y fotografía, básicamente toda la materia prima que compone la web.
No es difícil entender por qué.
Si ha seguido el auge de la IA, es posible que se haya encontrado con el término “minería de textos y datos”. Suena oscuro, tal vez incluso inofensivo. Pero básicamente significa lo que dice en la lata: algoritmos que rastrean enormes cantidades de contenido web para comprender patrones. Así aprende la IA a generar textos, imágenes, resúmenes y conversaciones.
Es algo inteligente, sin duda.
Pero hay una parte de la ecuación que algunos en la industria tecnológica en ocasiones se muestran reacios a discutir. Gran parte de ese material es propiedad de personas, autores, músicos, fotógrafos y periodistas, que a menudo dedican décadas a producirlo.
Y, comprensiblemente, no están muy contentos de servir como asistentes docentes no remunerados en el aula de IA.
“El daño potencial que podría infligirse a los creadores por el uso generalizado de la IA generativa sin los permisos de derechos de autor adecuados o el pago de una remuneración justa es claro y presente”, advirtió el Comité Digital y de Comunicaciones de la Cámara de los Lores en una sesión informativa dirigida al gobierno del Reino Unido. “Si esto sucede, las industrias creativas que desempeñan un papel tan importante en el éxito de la economía del Reino Unido podrían sufrir daños muy graves”.
Prácticamente se puede escuchar el resentimiento de los creadores sobre el tema.
Imagínese pasar años escribiendo un libro, un álbum o un portafolio fotográfico, solo para descubrir que la IA de alguna manera ha absorbido su estilo a lo largo del camino. Quizás no sea un plagio en el sentido clásico, pero se acerca lo suficiente como para sorprender a algunos. Pero aquí está el truco: el artista nunca lo sabría.
Es por eso que algunos formuladores de políticas creen que el default debería revertirse. La responsabilidad de demostrar que tiene licencia para el material que utiliza debe recaer en el proveedor de IA. ¿De dónde obtuvimos estos datos? ¿Cómo lo conseguimos? Hagamos esto transparente.
Suena sencillo. Es realmente complicado.
Pero es una idea que está ganando terreno. El Reino Unido no es el único país que está lidiando con el problema. La mayoría de los países están tratando de descubrir cómo controlar la IA sin estrangular su desarrollo.
Es un baile delicado.
La Unión Europea, por ejemplo, presentó recientemente su propia propuesta para una Ley de Inteligencia Artificial de la UE que apunta a aumentar la responsabilidad y la transparencia de los sistemas de IA. Está lejos de ser una panacea, pero demuestra que los gobiernos se toman en serio la gobernanza de la IA.
Pero aquí está la cuestión.
Cuando una jurisdicción se pone seria, otras suelen seguirla. Las empresas tecnológicas son globales, no respetan fronteras, por lo que una decisión tomada en Londres o Bruselas puede afectar cómo se desarrolla la IA en California, Toronto o Singapur.
Entonces, si bien esto puede parecer un problema del Reino Unido, en realidad es parte de un juego más amplio de tira y afloja.
Si el Reino Unido finalmente decide exigir licencias, es posible que los desarrolladores de IA tengan que reconsiderar por completo cómo adquieren sus datos de entrenamiento. Eso podría crear industrias completamente nuevas: empresas que otorgan licencias de datos, editores y organizaciones de noticias que se asocian con proveedores de IA, empresas enteras que surgen sólo para suministrar a las IA material del que aprender.
La disputa de datos podría ser una oportunidad de negocio.
Como era de esperar, la comunidad tecnológica no es demasiado optimista acerca de la perspectiva. Sostiene que exigir licencias para toda la información de la que aprende un sistema de IA podría obstaculizar la innovación o encarecerla. Entrenar grandes modelos de IA ya es prohibitivamente caro. A veces millones. A veces miles de millones. De dólares.
Si a eso le sumamos las tarifas de licencia, podría volverse peligroso.
Pero el enfoque del Lejano Oeste, de recopilar tantos datos como podamos ahora y preocuparnos por las cuestiones legales más adelante, puede estar llegando a su fin.
Independientemente de si eres un entusiasta de la IA, un trabajador tecnológico o simplemente un ser humano curioso que alguna vez se ha preguntado por qué los chatbots parecen volverse demasiado buenos para imitarte, el debate sobre los datos de entrenamiento se perfila como uno de los principales puntos álgidos de la era de la IA.
Y si la retórica del Reino Unido sirve de indicación, es una lucha que apenas comienza.