写作、绘画、视频……在创作领域,网友们已经数次因为生成式AI的“入侵”而吵得不可开交,而最近的一次争论来自配音圈。
近日,配音演员赵乾景授权、TME有声剧场推出的《凡人修仙传》AI有声剧正式上线。该剧中,通过训练出的多音色AI人声,使得赵乾景一人分饰多角,包括旁白、主角、配角等。
尽管AI配音技术早已应用在短视频配音、游戏角色配音、有声读物等众多领域,但此次“知名配音演员授权AI”消息一出,从配音演员粉丝、音频节目爱好者、配音从业者间开始发酵,迅速在网络引发舆论热议,相关词条数次登上微博主榜热搜。
是助力科技还是损害职业权益?围绕AI技术的争议仍将持续。但在声音领域,人的声音与AI声音间的权益之争应该如何界定?4月23日,北京互联网法院一审宣判的全国首例AI生成声音人格权侵权案给出了答案,明确认定在具备可识别性的前提下,自然人声音权益的保护范围可及于AI生成声音。
配音师声音被AI化后出售
“不是所有人都能功成名就,我们中有些人,注定要在日常生活的点滴中寻找生命的意义。”在一款名为“魔音工坊”的APP上,名为“魔小璇”的AI声音对外出售,配音师殷女士发现该声音的原型正是自己,而自己从没有授权过任何人或公司将自己的声音AI化。
殷女士的朋友在刷小视频时,发现一些电影和游戏的解说使用了殷女士的AI声音,就将消息告诉了她。殷女士这才发现,他人利用其配音制作的作品已在多个知名APP广泛传播,经过声音筛选和溯源,发现这些作品的声音均来自北京某智能科技公司运营的“魔音工坊”平台中的文本转语音产品。
原来,殷女士曾和北京某文化传媒公司合作,录制了几部有声读物。之后,这家文化传媒公司将这些录音制品提供给了一家软件公司。该软件公司以殷女士录制的作品为素材进行AI化处理,生成了一款文本转语音产品,并在上海某网络科技公司运营的云服务平台对外出售。此后,运营“魔音工坊”的科技公司与北京某科技发展公司签订在线服务买卖合同,由后者向上述软件公司下单采购这款文本转语音产品,在未经任何技术处理的情况下,直接调取并生成了名为“魔小璇”的文本转语音产品对外销售。
随后,殷女士以侵害其声音权为由,将北京某智能科技公司、北京某文化传媒公司、软件公司、上海某网络科技公司、北京某科技发展公司五被告起诉至北京互联网法院,要求北京某智能科技公司、软件公司应立即停止侵权、赔礼道歉,五被告应当赔偿其经济损失、精神损失。
自然人声音权益及于AI声音
殷女士起诉后,五被告在辩称中均否认侵权。
北京某智能科技有限公司认为,其作为善意第三人,不参与授权过程,通过正规途径合法采购了涉案人工智能合成声音产品,已尽到合理注意义务,不构成侵权。人工智能合成后的声音产品,与自然人声音在人身权属性上有所区别,目前技术都会对人工智能合成声音进行水印标记,切断了人工智能合成声音与自然人声音之间的联系,不会产生对应自然人的人格属性。
软件公司称,其已获得涉案声音的授权,不存在任何侵权的主观过错。涉案声音是经AI化的声音,不具有对原告人格的可识别性。
北京某文化传媒公司认为,其将有音频著作权及邻接权的录音制品用于与被告三某软件公司合作符合相关法律规定,各个环节都已签署协议和支付费用,不存在主观故意的侵权行为。上海某网络科技公司称其仅为云服务平台提供者,已尽到合理的注意义务;北京某科技发展公司称其非涉案AI声音的制作者也非使用者,对于是否侵权不知情,均认为不应承担侵权责任。
被告认为自然人的声音与AI化的声音是有区别的,因此,AI声音是否受到声音权益保护,成为本案的一大焦点。
法院经审理认为,自然人声音以声纹、音色、频率为区分,具有独特性、唯一性、稳定性特点,能够给他人形成或引起一般人产生与该自然人有关的思想或感情活动,可以对外展示个人的行为和身份。自然人声音的可识别性是指在他人反复多次或长期聆听的基础上,通过该声音特征能识别出特定自然人。利用人工智能合成的声音,如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格,关联到该自然人,可以认定为具有可识别性。
本案中,因被告软件公司系仅使用原告个人声音开发涉案文本转语音产品,而且经当庭勘验,该AI声音与原告的音色、语调、发音风格等具有高度一致性,能够引起一般人产生与原告有关的思想或感情活动,能够将该声音联系到原告本人,进而识别出原告的主体身份。因此,原告声音权益及于涉案AI声音。
“我国民法典将人格权独立成编,首次以立法形式将保护‘声音’写入民法典,明确参照适用肖像权的形式保护自然人的声音,体现了对人格权益全面尊重和保护的立法精神。”该案主审法官强调,声音作为一种人格权益,具有人身专属性,任何自然人的声音均应受到法律的保护,对录音制品的授权并不意味着对声音AI化的授权,未经权利人许可,擅自使用或许可他人使用录音制品中的声音构成侵权。
合法授权为判断侵权关键点
本案的另一焦点在于,被告是否拥有殷女士声音的合法授权。
法院认为,北京某文化传媒公司对录音制品享有著作权等权利,但不包括授权他人对原告声音进行AI化使用的权利。其与软件公司签订数据协议,在未经原告本人知情同意的情况下,授权软件公司AI化使用原告声音的行为无合法权利来源。
北京某文化传媒公司、软件公司未经原告许可AI化使用了原告声音,构成对原告声音权益的侵犯,其侵权行为造成了原告声音权益受损的后果,应承担相应的法律责任。北京某智能科技公司、上海某网络科技公司、北京某科技发展公司主观上不存在过错,不承担损害赔偿责任。因此,综合考量被告侵权情节、同类市场产品价值、产品播放量等因素,对损害赔偿予以酌定。
最终,北京互联网法院一审宣判,北京某智能科技公司、软件公司向原告赔礼道歉,北京某文化传媒公司、软件公司向原告赔偿损失共计25万元。
在中国政法大学传播法研究中心副主任朱巍看来,是否获得权利人的合法授权,这是判定是否构成声音权益侵权的一个关键点。著作权与民法典中规定的人格权是两回事,并不是说把我的声音、把我的形象,可以随便AI合成去进行商业宣传。该案解决了一个问题,“关于声音的编辑得需要当事人单独同意,不能一揽子拿走”。
北京互联网法院副院长赵长新在谈及该案时表示,该案原告声音形成了语音集,是一类数据集合,拥有行政机关颁发的知识产权认证书。在审理过程中,考虑到数据集合涉及商业利益,法院认可了语音集的认证书。AIGC时代的数据权益得到强调。
“如果一个具体的案例在平衡方面没有非常理性的判断,尤其是对于产业发展今后走向的判断,很可能一个判例就会影响整个互联网技术的发展,很可能会影响到AI技术进一步的发展。”赵长新表示,针对新纠纷,法官需要在现有的法律框架下不断对新技术规范进行研究,并且要非常审慎地把握平衡。