El diario asegura que millones de artículos se han utilizado para entrenar chatbots que ahora compiten con él. Es la primera reclamación de un medio estadounidense a empresas creadoras de IA
MARÍA ANTONIA SÁNCHEZ-VALLEJO / Nueva York / EL PAÍS
El diario The New York Times ha demandado a OpenAI y Microsoft por infracción de derechos de autor, alegando que la tecnología de inteligencia artificial de estas empresas copió ilegalmente millones de artículos para entrenar ChatGPT y otros servicios de información que ahora compiten con el contenido original del diario.
La denuncia, presentada este miércoles en el Tribunal Federal de Distrito de Manhattan (Nueva York), es la última de una serie de demandas que pretenden limitar el supuesto scraping (cribado) de amplias franjas de contenido de todo Internet -sin compensación alguna a los autores o las empresas editoras- para entrenar los llamados modelos de inteligencia artificial de gran lenguaje. Actores, escritores, periodistas y otros creadores que publican sus obras en Internet temen que la IA saque partido de sus contenidos originales y ofrezca chatbots competitivos y otras fuentes de información sin la debida compensación a la fuente.
Pero la demanda del Times reviste singular importancia por tratarse de la primera procedente de un gran medio de EE UU que se enfrenta a OpenAI y Microsoft, las marcas de IA más reconocidas. La reclamación recuerda de alguna forma las que constituyeron el prolongado litigio que medios de comunicación de todo el mundo han mantenido contra Facebook y Google por reproducir contenido sin compensar a las empresas editoras, y que Australia legisló con una iniciativa pionera.
En la demanda, sostiene el diario, el “uso ilegal del trabajo de The Times por parte de Microsoft y OpenAI para crear productos de inteligencia artificial que compitan con él amenaza la capacidad del diario para prestar ese servicio”. El periódico explica que OpenAI y Microsoft utilizaron otras fuentes en su “copia a gran escala”, pero “hicieron especial hincapié en el contenido del Times” buscando “aprovecharse de la enorme inversión del Times en su periodismo, utilizándolo para crear productos sustitutivos sin permiso ni pago”.
El rotativo neoyorquino es uno de los principales medios de EE UU, incluida la CNN, que a principios de este año añadieron código a sus sitios web para bloquear el rastreador web de OpenAI, GPTBot, y evitar así que escanee sus plataformas en busca de contenidos.
La compañía descubrió hace meses que su trabajo se había utilizado para hacer rodar los grandes modelos lingüísticos de las empresas de IA. En abril, empezó a negociar con OpenAI y Microsoft una compensación justa y cómo fijar los términos de un acuerdo. Pero, incapaz de llegar a un entendimiento con las dos tecnológicas, ha optado por la vía judicial. Microsoft y OpenAI alegan que divulgar contenido del Times entra dentro de los límites de un “uso justo o legítimo”, ya que, independientemente de que se trate de material protegido por derechos de autor, lo que persiguen es un “fin transformador”.
Pero, explica el texto de la demanda, “no hay nada transformador en utilizar el contenido de The Times sin pagar para crear productos que sustituyan a The Times y le roben audiencia”, una suerte de sucedáneo informativo gratuito. “Dado que los resultados de los modelos GenAI de los demandados compiten con el contenido utilizado para entrenarlos y lo imitan estrechamente, copiar obras del Times con ese fin no es un uso justo”.
Las herramientas de IA pueden “generar resultados que recitan el contenido del Times textualmente, lo resumen fielmente e imitan su estilo expresivo, como demuestran decenas de ejemplos. Estas herramientas también atribuyen erróneamente información falsa al Times”, afirma la denuncia. Es decir, el pirateo por herramientas de IA no solo priva al diario de ingresos por suscripciones, licencias, publicidad y afiliados, subraya la demanda, también incurre en el preocupante pantano de la desinformación. A menudo, el motor de búsqueda Bing de Microsoft, que se actualizó a principios de este año con la tecnología de OpenAI, “copia y categoriza” el contenido del diario para producir respuestas más largas y detalladas que los motores de búsqueda tradicionales, recuerda la demanda.
La vicepresidenta ejecutiva y consejera general de The New York Times, Diane Brayton, comunicó esta mañana a los empleados la acción judicial, asegurando que la empresa “reconoce el potencial de [la IA generativa] para el público y para el periodismo”. “Pero, al mismo tiempo, creemos que el éxito de GenAI y de las empresas que la desarrollan no tiene por qué producirse a expensas de las instituciones periodísticas”, según el mensaje de Brayton a la plantilla, al que tuvo acceso la CNN. “El uso de nuestro trabajo para crear herramientas GenAI debe venir con permiso y un acuerdo que refleje el valor justo de ese trabajo, como establece la ley”.
Microsoft y OpenAI no se han pronunciado por el momento acerca de la denuncia.
Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.