Se trata de la primera reclamación judicial de un medio de comunicación estadounidense a las empresas creadoras de IA
En la demanda, presentada ayer miércoles 27 en el Tribunal Federal del distrito de Manhattan, The New York Times asegura que millones de sus artículos se han utilizado para entrenar chatbots (como ChatGPT) que ahora compiten con el contenido original del diario. La denuncia es la más reciente de una serie de demandas que buscan restringir el uso del scraping -raspado- de amplias franjas de contenido de Internet (sin compensación alguna para los titulares de las publicaciones) para entrenar los llamados grandes modelos de inteligencia artificial de lenguaje.
El documento señala que OpenAI y Microsoft utilizaron otras fuentes en su “copia a gran escala”, pero “le dieron al contenido del Times un énfasis especial” buscando “aprovecharse de la gran inversión del Times en su periodismo y usándolo para crear productos sustitutivos sin permiso ni pago alguno».
El diario expone que en cuanto se percató de que su trabajo estaba utilizándose para entrenar a los modelos lingüísticos de IA, manifestó su oposición. Desde el pasado mes de abril, el Times estableció negociaciones con OpenAI y Microsoft para recibir una compensación justa. Pero Microsoft y OpenAI alegaron que la utilización del material protegido por los derechos de autor se estaba haciendo con un «propósito transformador».
«No hay nada transformador» -continúa la demanda-, «en utilizar el contenido del diario sin pago para crear productos que sustituyan al Times y le roben audiencia. Debido a que los resultados de los modelos de inteligencia artificial generativa de los demandados compiten con los insumos utilizados para entrenarlos y los imitan estrechamente, copiar el Times para ese propósito no es un uso legítimo».
Además, The New York Times alega que el motor de búsqueda Bing de Microsoft, actualizado a principios de este año con la tecnología OpenAI, «copia y clasifica» el contenido del Times para producir respuestas más largas y detalladas que los motores de búsqueda tradicionales. Y al proporcionar contenido del Times sin la autorización del diario, las herramientas de los demandados socavan y dañan la relación del Times con sus lectores y privan al mismo de suscripciones, licencias, publicidad e ingresos de afiliados»
La vicepresidenta ejecutiva y asesora general del diario The New York Times, Diane Brayto, ha reconocido en un comunicado dirigido a su propio personal «el potencial y el éxito de la IA generativa para el público y el periodismo» lo cual no significa que «tenga por qué venir a expensas de las instituciones periodísticas». En este sentido, considera que «el uso de nuestro trabajo para crear herramientas GenAI debe contar con un permiso y un acuerdo que refleje el valor justo de ese trabajo, como lo establece la ley».
Con su demanda, el periódico persigue un resarcimiento monetario proporcional al daño causado, así como una orden judicial permanente que impediría a Microsoft y OpenAI continuar con la supuesta infracción.
Añadir por último que el New York Times, junto con la CNN, fue uno de los medios de comunicación norteamericanos que a principios del 2023 añadieron código a sus sitios web para bloquear el rastreador web GPTBot (de OpenAI) en sus plataformas de contenido.