Un grupo de ocho periódicos estadounidenses ha presentado ante un tribunal federal una demanda contra las empresas tecnológicas Microsoft y OpenAI, alegando que han utilizado sin permiso sus artículos para entrenar modelos generativos de IA.
Dichos periódicos, propiedad del fondo MediaNews Group de Alden Global Capital, afirman en la demanda que Copilot, de Microsoft, y ChatGPT, de OpenAI, “roban millones de artículos de los editores, protegidos por derechos de autor, sin permiso ni pago alguno, a fin de impulsar la comercialización” de sus productos y servicios de IA generativa.
Los LLM (siglas inglesas de grandes modelos lingüísticos) de IA precisan de grandes volúmenes de datos para entrenar a sus chatbots de IA generativa, pero editores y autores sostienen que su contenido no puede utilizarse con dicho fin sin su consentimiento y remuneración económica.
Los editores de periódicos alegan que OpenAI, que cuenta con el apoyo de Microsoft, se ha servido de sus artículos para entrenar los LLM GPT-2 y GPT-3 y señalan que “el actual LLM GPT-4 produce copias casi literales de partes significativas de las obras de los editores, si se le solicita”.
“Tales ejemplos memorizados constituyen copias no autorizadas o trabajos derivativos basados en las obras propiedad de los editores, utilizadas para entrenar el modelo.”
En lo que respecta a Microsoft, la demanda acusa a dicha firma de copiar información de sus periódicos para su índice de búsqueda Bing, que a su vez ayuda a generar respuestas en su chatbot Copilot, sin proporcionar hipervínculos a los sitios web de los periódicos.
“Alucinaciones”
Por otra parte, la demanda también destaca las llamadas “alucinaciones” generadas por ChatGPT, como por ejemplo la afirmación de que un artículo de periódico atribuía erróneamente al tabaco la curación del asma.
“Como si no bastara con plagiar el trabajo de los editores, los productos de los demandados padecen a menudo ‘alucinaciones’, en las que dichos productos difaman la credibilidad de los editores atribuyendo falsamente información inexacta a los periódicos de estos. Además de beneficiarse del robo de contenidos propiedad de los editores, los demandados empañan activamente la reputación de los periódicos y hacen circular desinformación peligrosa.”
Un portavoz de OpenAI ha declarado a Mobile World Live que su firma tiene “mucho cuidado con sus productos y sus procesos de diseño, a fin de respaldar a los proveedores de noticias”.
“Si bien no estábamos al corriente de las preocupaciones de Alden Global Capital, participamos activamente en alianzas constructivas y mantenemos conversaciones con numerosos proveedores de noticias del mundo entero para estudiar oportunidades, debatir cualquier preocupación que pueda surgir y ofrecer soluciones.”
OpenAI ha suscrito acuerdos con empresas del sector de medios de comunicación, como por ejemplo el Financial Times y la multinacional Axel Springer, a fin de utilizar los contenidos de sus diversos sitios para entrenar sus LLM.
Un portavoz de Microsoft ha declinado hacer comentarios sobre la demanda.
Comments