两位作家指控苹果公司非法使用其作品来训练其人工智能模型,苹果公司因此再次遭遇版权诉讼。
该诉讼于周五在北加州联邦法院提起,指控苹果公司未经授权、未经信用或未经付款,使用 Grady Hendrix 和 Jennifer Roberson 的盗版书籍来构建其 OpenELM 大型语言模型。
拟议的集体诉讼使苹果公司越来越多因在训练数据集中使用受版权保护的材料而面临诉讼的科技公司名单。
起诉书称:“苹果公司并未试图为这些作者对这项可能利润丰厚的项目做出的贡献支付报酬。” 总部位于纽约的亨德里克斯和总部位于亚利桑那州的罗伯森声称,他们的作品属于一个盗版书籍数据集的一部分,该数据集长期以来在机器学习研究圈内流传。
针对苹果的诉讼正值一系列备受瞩目的法律纠纷之际,这些诉讼围绕着人工智能开发中使用受版权保护的材料展开。同一天,人工智能初创公司 Anthropic 表示,将支付 15 亿美元,以和解一群作者提出的索赔,这些作者指控该公司在未经适当许可的情况下训练了其聊天机器人 Claude。
尽管 Anthropic 并未承认责任,但原告律师称这笔交易是历史上最大的版权赔偿。
其他科技巨头也面临类似的诉讼。微软今年6月被一群作家起诉,声称他们的作品未经许可被用于训练其Megatron 模型。微软支持的Meta Platforms和OpenAI也被指控未经许可盗用受版权保护的作品。
对苹果来说,这起诉讼是一个挫折,因为该公司在今年早些时候发布 OpenELM 系列模型后,正寻求扩展其 AI 能力。这些模型被宣传为 OpenAI 和谷歌前沿系统的更小、更高效的替代品,旨在集成到苹果的硬件和软件生态系统中。
原告认为,苹果对盗版作品的依赖玷污了这些努力,并使公司面临不当得利的指控。
分析人士表示,苹果可能尤其容易受到攻击,因为它将自己定位为一家隐私至上、以用户为中心的技术提供商。如果法院发现其人工智能模型是基于被盗数据进行训练的,那么声誉受损的程度可能比任何经济处罚都更为严重。
这些诉讼也凸显了一个悬而未决的问题:版权法如何适用于人工智能训练。“合理使用”的支持者认为,接触文本类似于人类的阅读,为生成新材料提供了背景,而非复制原作。
反对者认为,未经许可批量摄入受版权保护的作品会剥夺创作者的合法报酬。
Anthropic 创纪录的和解协议可能会扭转局面。即使不承认责任,该公司也同意巨额赔偿,这暗示了在法庭上应对此类案件的风险。如果案件进入庭审阶段,苹果现在也面临着类似的财务风险。
如果您正在阅读本文,那么您已经领先一步了。请持续关注我们的新闻通讯。