2024年12月5日上午,北京大学人工智能研究院人工智能安全与治理中心主任张平教授应邀为我校学生开展以“AI训练数据版权合法性之困及解决路径探讨”为主题的讲座。讲座由中央财经大学法学院副教授张金平老师主持,全校数十名学生参加。本次讲座为法学院建院20周年系列讲座第10期,同时也受到中央财经大学“龙马奋进•75周年校庆”专题学术讲座资助计划支持。
张平教授先整体剖析了AI训练数据版权合法性问题产生的原因,并以此展开对AI训练数据版权之困的具体分析。张教授认为AI训练数据版权之第一困是高质量数据授权难。目前AI训练数据五大来源各有问题:利用“爬虫技术”爬取的网络信息受使用目的限制、从供应方购买的数据要按约定承担风险、公有领域内容仍面临著作人格权问题、开源社区资源受许可证约束及从著作权集体管理机构获得内容可能面临准确授权难。其次,张教授介绍了全球范围的AI训练数据侵权诉讼,包括Stability AI集体诉讼案、环球音乐集团等诉Anthropic案、纽约时报诉Open AI案、谷歌数字图书馆案、德国摄影师Kneschke诉LAION案及广州互联网法院“奥特曼”案等国内外著名判例,指出各国法院面临AI数据训练是否侵权的抉择。
随后,张平教授提出了AI训练数据版权之第二困即突破现行法难。张教授认为,我国在行政、司法方面作出调整的难度较大,但因人工智能属于我国头号发展产业,按照现行法认定AI训练未经许可使用高质量数据构成著作权侵权,将不可避免地影响我国人工智能的产业发展。然而,我国需对接CPTPP等高标准经贸规则的要求,难以限缩著作权权利范围;而著作权人可能因补偿金和版税制度等无法直接补偿其权益,缺少推动新制度建设的动力。数字水印、区块链、开放授权等解决方案,只能解决一部分问题,且面临巨额成本问题。
有鉴于此,张教授倡导作品的自愿捐献,或者构建有条件共享的高质量训练数据池,多措并举疏解人工智能数据训练合法之困。
总结发言环节,张金平副教授认为张平教授对于知识产权的本质及中国的人工智能产业在全球竞争格局下发展前景的突破与平衡作出了全景式的展示,展现了张平教授对人工智能数据训练问题研究的深度和广度,同时也为我们提供了很多值得深入思考的研究方向。
针对在座同学提出电商平台通过未明示的算法规则对商家进行处罚的透明度原则适用等问题,张平教授均进行了详细的解答。讲座在热烈的掌声中圆满结束。
文/图 王怡然
审/ 陈 诚