人类创作正在被机器创作取代并逐步超越!这是笔者在尝试使用Suno仅十五分钟后的第一感觉。作为一个对技术创新天生迟钝并对机器编程极度缺乏安全感的保守派来说,即便只是在一年前,这里的“感叹号”也许还只能是个“问号”。然而,当我们直面这个数字化时代,不得不承认人工智能(AI)正以前所未有的速度颠覆着各行各业的传统格局。据统计,预计到2029年,全球生成式AI市场规模将达到数十亿美元,年复合增长率达到30%以上。在这样一股不可忽视的力量面前,传统音乐行业遭遇了前所未有的挑战。近日,包括环球音乐集团、索尼音乐、华纳音乐在内的美国传统音乐巨头诉Suno、Udio案,正是这场传统音乐行业与AI碰撞的焦点之战。面对AI技术可能带来的版权侵蚀和利益再分配,站在音乐界金字塔顶端的巨头们已经感受到了威胁,并正在采取法律行动来捍卫自己的阵地。
一、单刀直入的诉讼主张——使用未经授权的版权内容训练人工智能模型构成侵权不同于人类学习所依仗的器官协同,机器学习无法避免地涉及到被学习素材的复制行为。也正因于此,诸多音乐版权公司(索尼公司、华纳公司等)正在联合起诉音乐生成式人工智能Suno、Udio公司,控诉被告利用原告持有的录音制品版权,来训练其开发的人工智能,并且要求其就每件侵权作品赔偿高达15万美元的巨额损失。
截止到发稿之日,由于本次案件仍在进行中,我们只能从可检索到的原告起诉状来一探究竟。音乐公司在起诉状中的思路,与之前的纽约时报诉Open AI案大致相同。一方面,原告主张被告利用了原告的录音制品版权训练人工智能,因此侵犯了被告的复制权。另一方面,原告对被告极有可能提出的合理使用抗辩进行了反驳。由于所涉作品业态不同,二者间也呈现出一定差异。
二、另辟蹊径的证明思路——侵权方自认+生成内容印证众所周知,对于任何一个AI大模型,想从其输出结果推知其学习过程中的语料库在原理上就是不可行的。因此,类似案件的证明思路只能另辟蹊径,从被诉大模型对于自身语料库的描述入手,再辅以其输出结果中的蛛丝马迹。早前同样轰动的纽约时报诉OpenAI案中,主要证明思路就是一方面从OpenAI自己披露的语料库中寻找原告享有专有权的内容,另一方面在输出结果中寻找侵权或如非侵权无法解释来源的内容(如纽约时报经深度调查独家发布的相关报道)。
与纽约时报案略有差异,本次案件的特殊性在于:(1)Suno或Udio所学习的大数据类型仅限于录音制品及其中所包含的音乐作品,不同于文字、新闻报道的是,录音制品、音乐作品更加难以被排除在版权保护范围之外;(2)原告集合了世界诸多大型音乐版权公司,并持有“世界绝大多数”的录音制品权。这意味着,如果Suno或Udio要进行大数据学习,难以绕开原告所持有的版权。
“如果没有复制这些录音的初始行为,不可能建立一个能够产生与版权录音如此相似的音频的模型。”
“如果得到版权所有者的许可和参与,人工智能生成工具将能够协助人类创作和生产新的创新音乐。但如果不负责任地开发,无视基本的版权保护,这些工具将对唱片艺术家、唱片公司和音乐产业造成不可挽回的持久伤害,不可避免地降低消费者可获得的新音乐的质量,削弱我们的共享文化。”
同时,为了向法官更好地说明被告的大数据学习行为必然会侵犯原告的录音制品版权,原告延续了纽约时报案的论证思路并列举了以下例证:
第一,原告引用了被告公司人员的“自认侵权式”发言:
Udio首席执行官兼联合创始人:“Udio获得高质量输出的唯一途径是对‘大量公开的高质量音乐’进行训练,Udio的模型是在‘最优质的音乐’上训练出来的”。
Suno公司的风险投资人:“这是‘我们投资该公司时必须承担的风险’。老实说如果我们在公司成立之初就与唱片公司达成了协议,我可能就不会投资了。我认为,他们需要在不受制约的情况下生产这种产品。”
第二,原告向法院解释了音乐生成式AI的训练步骤,并且通过案例演示得出结论:在用户向AI输入特定提示词的情况下,会得到与原告版权作品高度相似的输出结果。如果训练时没有接触过原告版权作品,这一现象难以解释。
例如:在用户输入提示词“pop punk American alternative rock California 2004 rob Cavallo”的情况下,Udio生成了歌曲“Subliminal Hysteria”。该歌曲与Green Day的名曲“American Idiot”十分相似,尤其是“don’t want a nation under the new media”、“the subliminal mind America”这两句歌词的旋律与原版中的相应短语几乎完全相同。在本次案件中,虽然尚未见到被告的答辩状,但参考先例可以想见被告会以“合理使用”为由抗辩侵权,对此原告在起诉状中也进行了一定的预先回应。
具体来说,在美国版权法上,合理使用的传统判断标准是“四要素”:(1)使用目的和性质;(2)版权作品的性质;(3)被告的使用占版权作品的数量和质量;(4)被告的使用对版权作品市场的影响。围绕上述四大要素,原告音乐公司指出被告的使用行为基于商业目的,构成对原作的大量核心部分的使用,且对原作市场造成了重大威胁,因此不构成“合理使用”。
然而,AI语言模型的“合理使用”抗辩亦有可能会被法院支持。美国法院对“合理使用”的认定采取宽松的立场,其中最典型的案件是谷歌公司数字图书馆案。该案中,谷歌公司在未经授权的情况下将图书数字化并收录到其搜索引擎中,这些书籍包括已出版的和未出版的作品。上诉法院认为谷歌所采取的扫描行为是高度转换性的,其显示的文字数量是有限的,而向公众提供的只言片语也不会与原作品构成竞争或替代关系,因此不构成侵权。“转换性使用”与“合理使用四要素”标准并不矛盾,而是旨在解决合理适用第一个要素(目的)的论证难题。根据王迁教授的观点,“转换性使用”是指通过增加新的美学内容、新的视角、新的理念或通过其他方式,使原作品在被使用过程中具有了新的价值、功能或性质,从而改变了其原先的功能或目的。在本次案件中,如果被告Suno、Udio公司能够证明其音乐生成式AI大数据学习行为构成“转换性使用”,被告合理使用的抗辩尚有可能会得到法院支持。
但是,同样的案例放在我国的司法实践中,可能就会有截然不同的结果。“合理使用”制度规定在我国《著作权法》第二十四条,不仅类型局限于法律、行政法规明文列举的类型,而且要求符合“非商业使用目的”要件。然而,生成式AI大数据学习行为既不属于法定类型,也通常不满足“非商业使用目的”要件。同时,不同于美国法,我国法院的法官不具有“判例造法”的权力。因此,在严格遵循法律法规进行判决的情况下,“合理使用”抗辩恐怕很难得到我国法官支持。本次案件的发酵,也给公众带来了一些担忧:在这些行业版权巨头的“阻挠”之下,新兴的生成式AI公司还能够发展起来吗?我们还能享受生成式AI给我们带来的福利吗?
针对生成式AI大数据学习阶段的侵权问题,人类司法似乎尚没有一份生效判决文书给出结论。在我国司法实践中,有三个相关的案件或许可以关注。
2023年6月13日,笔神作文发文指责学而思在大模型-MathGPT的研发使用过程中盗取其作文库存,并提供了学而思的“爬虫”非法访问记录以作证明。但最终于8月4日,笔神作文宣布决定不起诉学而思相关数据调取行为。该案虽然明面上结果不了了之,但是可猜想双方应该是通过协商达成了和解。
2024年2月,广州互联网法院作出(2024)粤0192民初113号民事判决,该案被称为“全球AIGC平台侵权第一案”。遗憾的是,尽管该案原告也主张了被告存在大数据训练侵权行为,但法官却实质上以“被告是生成式AI服务提供者,而不是模型开发者”为由,巧妙地回避了对AIGC平台大数据训练是否侵权问题的讨论。
2024年6月20日,北京互联网法院在线开庭审理了全国首例涉及AI绘画大模型训练著作权侵权案。在该案中,原告主张被告抓取原告作品输入AI模型的行为,侵犯了原告的复制权。该案现在仍在审理过程中,法院是否会支持原告诉请,对生成式AI的数据学习行为如何判定性质,将对后续的案件具有引领性意义。
笔者认为,态度无需悲观。知识产权相关法律的规定,本就具有较强的政策导向性。将原本自由传播的信息构建成法律上的财产,正是出于推动科技发展、社会进步和保护某些特定利益的公共政策需要。[1]因此,在人工智能全速发展的窗口期,相信各国政府并不会一味地墨守成规,而是会保持对新技术的开放心态,在信息自由传播、科技发展、社会进步以及特定群体利益等各项法益之间,重新划定知识产权专有权的保护范围,而这一切归根结底都是为了社会福祉的最大化。我们也将全程跟踪这一过程的最新发展,让我们一起拭目以待。[1]王迁教授,《知识产权法教程》(第七版)第3页,中国人民大学出版社。