八家美国报刊对微软和OpenAI提起联邦法院诉讼,称这两家科技公司没有得到他们的允许就使用其文章训练生成式人工智能模型(generative AI models)。

这几家报刊是由对冲基金奥尔登环球资本旗下媒体新闻集团拥有,在诉讼中表示,微软的Copilot 和OpenAI的ChatGPT正在“未经许可和无偿偷窃出版商数百万篇受版权保护的文章,以推动其生成式人工智能(GenAI)产品和服务的商业化”

人工智能大规模语言模型(AI LLMs)需要获取大量数据来训练他们的生成式人工智能聊天机器人,但是出版商们和作者们认为,没有征得他们的同意和财务补偿情况下,他们的内容不能用作此类目的。

这些报刊的出版商声称,微软的OpenAI使用他们的文章训练其GPT-2 和GPT-3 LLMs,而且指出“当前的GPT-4 LLM将在提示时输出出版商作品的重要部分几近一字不差的副本。”

“这些记忆的例子构成了出版商作品未经授权的复制品或衍生作品,用于培训模型”。

诉讼声称,对于微软这家科技巨头正在从他们的报刊上复制信息,用于其必应搜索索引,帮助其Copilot聊天机器人依次生成答案,而无需提供指向报刊网站的超链接。

错觉

诉讼也强调ChatGPT生成了错觉,例如,一篇报刊的文章错误地认为吸烟可以治疗哮喘。

“似乎剽窃出版商的作品还不够,被告方的产品常常受“错觉”影响,这些产品错误地将不实的报道归咎于出版商的报刊,从而诽谤出版商的信誉。除了从出版商的内容被盗中获利外,被告方还积极玷污报刊的声誉和传播危险的虚假信息。”

OpenAI公司的一位代表告诉Mobile World Live公司“在我们的产品和设计过程中十分谨慎,以支持新闻出版机构”。

“虽然我们之前并不知道奥尔登环球资本的担忧,但我们正积极地与世界各地的许多新闻机构建立合作伙伴关系和对话,以寻求机会,讨论任何问题并提供解决方案”。

OpenAI已经与《金融时报》和跨国媒体机构Alex Springer等媒体签署了协议,使用来自各种媒体网站的内容来训练其LLM。

微软的一位代表拒绝就此诉讼发表评论。