¿Es un delito aprender algo leyendo un libro protegido por derechos de autor? ¿Qué pasa si luego le resumes ese libro a un amigo o escribes una descripción en línea? Por supuesto, estas cosas son perfectamente legales cuando un persona los hace. Pero, ¿eso cambia cuando es un sistema de inteligencia artificial el que lee, aprende y resume?
Sarah Silverman, comediante y autora del libro. El que moja la cama, parece pensar que sí. Ella y varios otros autores están demandando a OpenAI, la compañía de tecnología detrás del popular chatbot de IA ChatGPT, a través del cual los usuarios envían mensajes de texto y reciben respuestas generadas por IA.
La semana pasada, un juez federal rechazó en gran medida sus afirmaciones.
El fallo es sin duda una buena noticia para OpenAI y para los usuarios de ChatGPT. También es una buena noticia para el futuro de la tecnología de inteligencia artificial en general. Las herramientas de IA podrían verse completamente paralizadas por la visión expansiva de la ley de derechos de autor que Silverman y los otros autores en este caso imaginan.
¿Quieres más información sobre sexo, tecnología, autonomía corporal, derecho y cultura online? Suscribirse a Sexo y tecnología de Razón y Elizabeth Nolan Brown.
Las quejas de los autores y la respuesta de OpenAI
Enseñar a la IA a comunicarse y “pensar” como lo hace un humano mucho de texto. Con este fin, OpenAI utilizó un enorme conjunto de datos de libros para entrenar los modelos de lenguaje que impulsan su inteligencia artificial. (“Lo que realmente importa es el volumen de texto utilizado, más que cualquier selección particular de texto”, OpenAI explicado en su moción de desestimación).
Silverman y los demás dicen que esto viola la ley federal de derechos de autor.
Los autores Paul Tremblay y Mona Awad presentaron una denuncia colectiva en este sentido contra OpenAI el pasado mes de junio. Silverman y los autores Christopher Golden y Richard Kadrey presentaron una denuncia colectiva contra OpenAI en julio. El trío también presentó una demanda similar contra Meta. En los tres casos, el abogado principal fue el abogado antimonopolio Joseph Saveri.
“Como ocurre con muchos abogados de demandas colectivas, el objetivo generalmente es enriquecer a los abogados de demandas colectivas, en lugar de detener cualquier error real”. sugirió Techdirt El editor en jefe Mike Masnick cuando se presentaron las demandas por primera vez. “Saveri no es un experto en derechos de autor, y las demandas… lo demuestran. Hay un montón de suposiciones sobre cómo Saveri parece pensar que funciona la ley de derechos de autor, lo cual es totalmente inconsistente con cómo funciona realmente”.
En ambas demandas contra OpenAI, Saveri afirma que las obras protegidas por derechos de autor, incluidos los libros de los autores de esta demanda, “fueron copiadas por OpenAI sin consentimiento, sin crédito y sin compensación”.
Esta es una forma realmente extraña de caracterizar cómo funcionan los conjuntos de datos de entrenamiento de IA. Sí, las herramientas de IA “leen” las obras en cuestión para poder aprender, pero no es necesario Copiar las obras en cuestión. También es una comprensión extraña de la infracción de derechos de autor, similar a argumentar que alguien que lee un libro para aprender sobre un tema para una presentación está infringiendo la obra o que los motores de búsqueda están infringiendo cuando escanean páginas web para indexarlas.
Los autores en estos casos también se oponen a que ChatGPT escupe resúmenes de sus libros, entre otras cosas. “Cuando se pidió a ChatGPT que resumiera los libros escritos por cada uno de los demandantes, generó resúmenes muy precisos”, afirma Silverman et al. queja.
Una vez más, poner esto en cualquier otro contexto demuestra lo tonto que es. ¿Los críticos de libros están infringiendo los derechos de autor de los libros que reseñan? ¿Alguien que lee un libro y tuitea sobre la trama está violando la ley de derechos de autor?
Sería diferente si ChatGPT reprodujera copias de libros en su totalidad o escupiera grandes pasajes palabra por palabra de ellos. Pero la actividad que los autores alegan en sus denuncias no es esa.
Las reclamaciones de derechos de autor en este caso “conciben erróneamente el alcance de los derechos de autor, al no tener en cuenta las limitaciones y excepciones (incluido el uso legítimo) que dejan espacio para innovaciones como los grandes modelos de lenguaje que ahora están a la vanguardia de la inteligencia artificial”, argumentó OpenAI en su moción para desestimar algunas de las reclamaciones.
Sugirió que la doctrina del uso legítimo, diseñada en reconocimiento del hecho de que “el uso de materiales protegidos por derechos de autor por parte de innovadores de manera transformadora no viola los derechos de autor”, se aplica en este caso y en el de “innumerables productos de inteligencia artificial”. [that] han sido desarrollados por una amplia gama de empresas de tecnología”.
El tribunal interviene
Los autores que prevalecen aquí podrían obstaculizar seriamente la creación de modelos de aprendizaje de idiomas con IA. Afortunadamente, el tribunal no acepta muchos de sus argumentos. En un 12 de febrero decisiónla jueza Araceli Martínez-Olguín del Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California desestimó la mayoría de los reclamos de los autores contra OpenAI.
Esto incluyó las acusaciones de que OpenAI incurrió en una “infracción vicaria de derechos de autor”, que violó la Ley de Derechos de Autor del Milenio Digital (DMCA) y que fue culpable de negligencia y enriquecimiento injusto. El juez también rechazó parcialmente un reclamo de competencia desleal según la ley de California, al tiempo que permitió a los autores continuar con ese reclamo en parte (en gran parte porque la comprensión de California de “competencia desleal” aquí es muy amplia).
Silverman y los otros autores en estos casos “no han alegado que los resultados de ChatGPT contengan copias directas de los libros protegidos por derechos de autor”, señaló Martínez-Olguín. Y “no explican lo que implican los resultados o alegan que cualquier resultado en particular es sustancialmente similar -o similar en absoluto- a sus libros”.
El juez también rechazó la idea de que OpenAI eliminara o alterara la información de gestión de derechos de autor (como lo prohíbe la Sección 1202(b) de la DMCA). “Los demandantes no aportan ningún hecho que respalde esta afirmación”, escribió Martínez-Olguín. “De hecho, las Quejas incluyen extractos de resultados de ChatGPT que incluyen múltiples referencias a [the authors’] nombres.”
Y si OpenAI no violó la DMCA, entonces otros reclamos basados en esa supuesta violación, como que OpenAI distribuyó trabajos con información de gestión de derechos de autor eliminada o participó en prácticas comerciales ilegales o fraudulentas, también fracasan.
Más batallas entre IA y derechos de autor por venir
Este no es el final del debate entre autores y OpenAI. El juez aún no se pronunció sobre su reclamo por infracción directa de derechos de autor porque OpenAI aún no intentó desestimarlo. (La compañía dijo que intentará resolver eso más adelante en el caso).
El juez también permitirá a las partes presentar una demanda enmendada si así lo desean.
Dada la cojera de sus argumentos legales y la desestimación por parte del juez de algunas de las reclamaciones, “es difícil ver cómo sobrevivirá alguno de los casos”. escribe Masnick. (Consulte su publicación para obtener una visión más detallada de los reclamos involucrados aquí y por qué un juez los desestimó).
Desafortunadamente, es casi seguro que seguiremos viendo gente demandando a empresas de IA (modelos de lenguaje, generadores de imágenes, etc.) por motivos dudosos, porque Estados Unidos se encuentra en medio de un creciente pánico tecnológico de IA. Y cada vez que surge un nuevo pánico tecnológico, vemos personas tratando de ganar dinero y/o hacerse un nombre lanzando un montón de acusaciones endebles en forma de demandas. Hemos visto esto con las empresas de redes sociales y la Sección 230, las redes sociales y los supuestos daños a la salud mental de los adolescentes, todo tipo de empresas de tecnología populares y las leyes antimonopolio.
Ahora que la inteligencia artificial es la favorita tanto de la exuberancia tecnológica como de la histeria, mucha gente, desde burócratas de la Comisión Federal de Comercio a abogados emprendedores de todo tipo de los medios tradicionales creadores y proveedores—buscan extraer dinero de estas tecnologías.
“Entiendo por qué a las empresas de medios no les gusta que la gente se capacite en sus documentos, pero creo que así como a los humanos se les permite leer documentos en la Internet abierta, aprender de ellos y sintetizar ideas completamente nuevas, a la IA también se le debería permitir hacerlo”. ,” comentó Andrew Ng, cofundador de Coursera y profesor adjunto en Stanford. “Me gustaría que la formación en Internet pública estuviera cubierta por el uso legítimo (la sociedad estará mejor de esta manera), aunque en última instancia dependerá de los legisladores y los tribunales si realmente lo está”.
A diferencia de mucha gente que escribe sobre tecnología, no preveo importante interrupciones, buenas o malas, provenientes de la IA en el corto plazo. Pero hay muchos beneficios y eficiencias menores que la IA puede aportarnos, si podemos evitar que la gente obstaculice su desarrollo con una lectura maximalista de la ley de derechos de autor.