朱开鑫 腾讯研究院高级研究员

“当AI只接收来自人类的提示文本,并输出复杂的文字、图像或音乐时,创作性的表达是由AI技术而非人类确定和执行。上述内容不受版权保护,不得注册为作品。” 这是2023年3月16日生效,美国版权局关于AIGC版权注册最新指南的内容。1这意味着,目前在美国ChatGPT类产品生成的内容将不会被注册为作品。

近期,Open AI“GPT4”新系统的发布和百度“文心一言”的推出,也将国内对AIGC版权问题的探讨再次推向高潮。本文希望结合国内外在AIGC版权领域的既有案例实践,就目前ChatGPT类产品生成内容的版权属性、权利归属与责任机制等各界关注的问题,尝试做一前沿性理论探讨。

以案说法:

美国版权局率先拒绝对ChatGPT类产品生成内容进行作品登记

2023年2月21日,美国版权局在“黎明的扎利亚版权注册案”2(以下简称“Midjourney案”)中,率先对ChatGPT类产品生成内容的版权属性做出否定性裁决。“用户利用Midjourney这一AI绘图工具生成的漫画内容不构成版权作品,因为在图像生成过程中3没有自然人的创造投入,而是由Midjourney自动随机形成”。在3月16日的指南中,美国版权局再次明确了上述立场“根据对生成式人工智能技术的理解,用户对于输出的内容不具有创作性贡献和控制,应当拒绝版权注册申请”。4
“Midjourney案”中,申请人曾反驳道,“和画笔以及其他绘图软件无异,Midjourney在漫画生成过程中仅仅是被用来完成用户内心希望呈现图像的工具。”对此,美国版权局表示,用户无法预测和控制Midjourney 最终输出的图像形态,这一重要事实使得其与传统绘图工具存在本质区别。当使用画笔或一般绘图软件时,画家可以选择构图的起点,通过工具和材料的具体选择实现线条粗细、色彩明暗等的具体修改,并采取自身希望的步骤来形成最终的图像,整个过程相当于画家“将自己内心的最初构图一步步赋予外在的表现形式”。
而Midjourney则是以一种用户不可预测的方式直接生成图像,其过程可以概括为:
首先,向用户界面输入一段描述“目标图像”的提示文本;
其次,选择Midjourney输出的一个或多个图像来进一步生成目标图像;
再次,调整或改变提示文本,以生成新的中间图像;
最终,经过多次重复形成中间图像的过程,选择一个满意的输出结果。
相较于传统画家的“创作”过程,用户利用Midjourney输出图像更类似于一个“试错”的过程。用户可能需要向Midjourney提供了“成百上千的描述性提示”,经历“数百次的中间图像迭代”才获得最终结果。既可能带来超出用户预期的惊喜,也可能让用户最终“失望而归”。总而言之,由于用户对Midjourney生成的图像不具有控制力和预期性,所以无法论证用户在其中的创造性投入或干预。

内在原因:

ChatGPT生成内容不构成作品是因为难以证明用户的创作贡献

从“Midjourney案”的上述裁定可以得出,美国版权局拒绝对目前ChatGPT类产品生成内容进行版权保护的直接原因是,难以证明“用户(自然人)对于AIGC模型生成的内容存在创造性的贡献”。但深层次的原因是,美国立法、司法以及行政机关一直坚守一个基本理念,即只对自然人创作的作品进行保护。“作者”一词意味着,一件作品要想获得版权,它必须归功于人的创作。长期以来,完全由自然界、动物产生的内容素材都不会被认定为版权法上的作品,比如黑猩猩拍照,又如风力侵蚀形成的石像。
美国版权局此前已经多次拒绝将包括AI在内的计算机工具、系统登记为作者,或者将相关生成内容登记为作品。2020年3月30日,美国版权局基于“人类思维和内容创造性呈现之间的联系是赋予版权保护的前提”这一基本原则,拒绝了对计算机生成画作“天堂入口”(A Recent Entrance to Paradise)的版权登记。5原因也是该画作缺乏赋予版权所需的“人类作者身份”——申请人没有提供证据证明自然人对该作品有足够的创造性投入。
实际上,国际保护知识产权协会(AIPPI)在2019年9月18日发布的《关于人工智能生成作品版权问题的决议》中也表明了相同的立场。“只有在作品的创作过程中存在自然人的干预贡献,人工智能生成的内容才有资格构成作品。如果没有自然人的干预,人工智能生成的内容不应受到版权的保护。”
从我国司法实践来看,自然人创作也是作品成立的必要条件。在2018年的“菲林诉百度案”中,海淀法院和北京知产法院明确表示涉案分析报告系由“威科先行数据库”的“可视化”功能自动生成,某种意义上只能认可是“威科先行库‘创作’了该分析报告”。6由于分析报告不是自然人创作的,因此即使涉案分析报告外在呈现具有客观上的独创性,仍不是《著作权法》意义上的作品。
也有观点指出,“我国和美国在版权领域都存在职务作品或者雇佣作品制度,能否将人工智能生成内容认定为雇佣作品,进而将权利配置给使用人工智能的用户或公司”。答案是否定的,因为上述观点实际上“本末倒置”了。雇佣作品或职务作品的制度目的都不是解决特定内容是否构成版权法上的作品,而是对已经构成作品的权利归属进行特殊的分配。作品必须首先由自然人创作完成,然后再根据创作的特定目的判断是否将相关权利赋予其他自然人或者法人、其他组织。
在“天堂入口案”中,申请人Thaler主张,“人工智能可以成为作者,因为雇佣作品原则允许拟制的人(如公司)成为作者”,但美国版权局认为这绝无成立可能。首先,雇佣作品必须是由与公司签署雇佣协议的自然人完成,或者由一个或多个自然人在单独的书面协议中明确约定生成的作品是雇佣作品。在这两种情况下,雇佣作品都是合同约定的结果,但人工智能无法签订有约束力的法律合同。其次,雇佣作品规则只涉及作品所有者的认定,而不涉及“特定内容本身是否构成作品、受版权保护”这一前置性问题。

澄清误区:

我国AI版权领域两个代表性案例并不存在法律论证上的冲突

不同于“菲林诉百度案”,深圳南山法院在2019年审理的“腾讯诉网贷之家案”7中,则认定由“Dreamwriter软件”辅助创作的财经文章构成《著作权法》上的作品。由此,后续国内很多观点便认为,我国司法实践中对于AI生成内容是否构成作品,存在法律认定上的分歧甚至冲突。但实际上,两地法院的法律论证观点具有根本上的内在一致性:AI生成内容只有证明存在自然人的独创性贡献才会被认定为作品。不同的判决结果归因于两个案件涉及的AI模型(或者说机器模型)在运行机制方面存在本质区别。
在“腾讯诉网贷之家案”中,法院明确表示“Dreamwriter软件”是一种“写作助手和辅助创作工具”,而在“菲林诉百度案”中法院对威科先行数据库“可视化报告”功能强调的是“自动生成工具”。是否存在“人类作者”或者“自然人创作贡献”的“关键问题”是,计算机是“仅仅作为一种辅助工具”,还是实际自动“构思并执行了作品中的创作要素”。AI模型软件“辅助创作”与“自动生成”的差别,实际从根本上决定了用户对于生成内容是否存在创作贡献,也即决定了AI生成内容能否构成作品。
在“腾讯诉网贷之家案”中,法院指出涉案文章的表现形式是由,“Dreamwriter软件”的具体使用者——原告主创团队人员的个性化安排与选择所决定的。在涉案文章生成过程中,文章框架模板的选择和特定用语的设定、数据抓取和填补触发条件的设定等均由主创团队相关人员选择与安排。原告主创团队的上述选择与安排属于与涉案文章的特定表现形式之间具有直接联系的智力活动,符合著作权法关于创作的要求。
在“菲林诉百度案”中,法院指出涉案分析报告在软件开发和软件使用两个环节有自然人参与,但都不存在创作性贡献。软件开发者没有根据其需求输入关键词进行检索,该分析报告并未传递软件研发者思想、感情的独创性表达;而软件用户仅提交了关键词进行搜索,应用“可视化”功能自动生成的分析报告亦非传递软件用户思想、感情的独创性表达。因此,涉案报告未能证明自然人的创作性贡献于其中,不能构成文字作品。
实际上,3月16日美国版权局新发布的注册指南也再次明确,AI工具的不同内在机制和原理,决定了生成内容版权属性的判定。“利用AI工具生成的内容,能否证明存在自然人的创作贡献,进而判定是否构成作品,答案取决于AI工具生成内容的机制原理,以及AI工具是如何被自然人用来生成最终内容的。”

问题症结:
混淆AI“自动生成”和“辅助创作”引发国内版权领域的争议

可以说目前,国内各界对于AI生成物是否构成作品之所以长期存在争议,很重要的原因在于没有把讨论的前提界定好,把AI自动生成和辅助创作混为一谈。实际上,虽然世界知识产权组织(WIPO)对于AI生成内容的作品属性尚无明确认定结论,但在2020年5月29日发布的《经修订的关于知识产权政策和人工智能问题的议题文件》8中,便已经阐释自动生成和辅助创作的划分是解决这个问题的前提。文件表明,“人工智能生成”与“人工智能自动创作”是可以互替使用的术语,系指在没有人类干预的情况下由人工智能生成产出。要与“人工智能辅助完成的”产出加以区分,后者需要大量人类干预和/或引导。
从国内外案例实践来看,法院系统和版权行政机关一个相对清晰的共识是,目前ChatGPT这类AI自动生成模型如不能证明自然人的创作性贡献,则无法将生成内容认定为作品加以保护;而对于AI辅助创作的内容,因为是由自然人主导和控制,具有自然人的创作贡献则可以被认定为作品。由此关键的问题是,在什么情况下人类参与AI等创作工具生成的内容符合作品保护的法定标准——存在自然人的创作贡献?
这里以2014年8月27日,美国版权局裁决的MK公司“絮状物分析仪样本图像(Sample Floc Analyzer Image)”版权注册案为例。MK公司主张利用“絮状物分析仪”生成样品分析图像的过程,可以比作“人利用相机创作普通摄影作品的过程”:絮状物分析仪相当于专门设计用来拍摄纸张或其他薄片样本的特殊相机,这个特殊相机由一系列的软硬件设备构成。9
美国版权局表示,摄影师可以凭借对拍摄主题、角度、亮度的选择以及拍摄时间的瞬间把握,满足摄影作品独创性的要求。但本案中,申请人并没有做出版权法意义上的创造贡献,只是在实施絮状物分析仪要求的操作方法:除了将一张纸送入机器并指示程序分析纸张中的絮状物厚度之外,对于最终输出的内容没有任何可归于自己的创造性贡献。同时申请人明显也不存在版权法上的创作初衷,因此其操作絮状物分析仪生成的内容难以构成版权法上的作品。

新的关注:

“prompt”本身的独创性不影ChatGPT生成内容的属性判断

由此,我们不禁开始反思当用户以“prompt”提示文本的方式对ChatGPT进行提问或者要求Midjourney输出一幅图画时,可能并不存在创作的目的。此时,用户更像是利用搜索引擎,检索自己需要的文字答案或者图片的行为。毫无疑问,我们不会认为检索本身是一种创作行为。但当游戏插画师利用“photoshop”这类辅助创作软件进行绘图时,我们则不会怀疑他们在进行一种美术创作。这里有一个新的疑问需要回应——“当用户提供了足够具体的‘prompt’时,其对于AI输出的内容是否便具备创作贡献,相应的内容也便可以被认定为作品?”实践中,用户为了尽可能获得和预期相一致的文字或图像,确实可能会向ChatGPT或Midjourney输入一段经过构思设计的提示文本。但实际上,不论“prompt”多具体,即便“prompt”本身可能构成文字作品,也无法改变目前ChatGPT类产品作为AI“自动生成”而非“辅助创作”的本质,因为用户本质上仍无法直接控制和准确预见输出的内容。
例如,在前述“Midjourney案”中,美国版权局否定了申请人的抗辩,即AI生成图像是“自然人撰写的独创性提示文本的外在视觉呈现”。美国版权局指出,虽然存在将申请人“prompt”本身注册为文字作品的可能。但对于Midjourney输出内容而言,并不能保证申请人特定“prompt”会产生与之直接对应的视觉呈现。相反,申请人输入“prompt”的行为更接近于一种建议,类似于客户委托艺术家创作图像的情形。
假设申请人委托一位漫画家创作一幅图像,要求包含“一位名叫Raya的老年白人妇女”,“Raya有一头卷发,她坐在一艘宇宙飞船内”,并指示该图像具有“星际迷航”的画风。当漫画家按照上述要求完成图像后,相信没有人会认为是申请人创作了这幅图像,虽然她提出了明确的图像内容要求。当然该图像可以成为雇佣作品,但实际创作者无疑是收到申请人指示并决定如何具体创作这些元素要求的漫画家。
同理,如果申请人在谷歌中输入这些搜索指示,也不能声称根据她“检索关键词”获得的图像是由其“创作”的,无论最终谷歌展示的结果图像与她的内容描述多么契合。

法律定位:

如何在著作权制度下对于ChatGPT生成内容加以保护?

从著作权制度视角看,可以探索对AI“辅助创作”和“自动生成”的内容进行二分保护Dreamwriter等AI辅助创作工具,在法律认定层面和传统的创作工具相同:由自然人控制,输出包含自然人创作贡献的内容;只要生成的内容符合特定作品的形式要求,便可以被认定为文字、美术、视听等作品。而ChatGPT、Midjourney等AI自动生成工具,通过用户输入“prompt”生成特定内容,因为缺乏自然人的独创性贡献,实际上难以满足《著作权法》对于作品的要求。
但这并不意味着著作权制度,无法为ChatGPT类产品的生成内容提供保护。作为大陆法系国家,我国采用广义的著作权制度,除作品之外还对“邻接权内容”加以保护,比如录音录像制品、广播电视节目等。邻接权不要求权利人对生成的内容付出创作性贡献,而是强调在内容形成的过程中权利人是否有相关投入(包括劳动、金钱和时间等),这便契合了目前ChatGPT类产品生成内容的客观属性。对于ChatGPT类产品的输出内容而言,用户虽然没有创作性贡献,但无疑存在实质性的投入,比如花费大量时间构思输入“prompt”,又比如特定产品和服务使用费的支出。
而作为“普通法系国家”的美国,在版权法中仅仅存在作品制度而不存在邻接权制度,即仅对“存在自然人创作性贡献的内容”加以保护。美国最高法院多次表示,作为一个宪法问题,版权只保护那些超过最低限度创造性的作品。如果内容中“完全缺乏创造性的火花,或轻微到不存在的程度”,就不能获得版权法的保护。
在“Midjourney案”中,美国版权局表示并不质疑申请人花了大量时间和精力使用Midjourney生成图像,但这种付出并不意味着申请人存在版权法下的创作性贡献。美国法院早已明确拒绝“额头流汗原则”可以作为版权保护的基础。美国版权局也表示“不会考虑创作所需的时间、精力或费用”,因为这些因素“对特定内容是否具备版权法和宪法所要求的‘最低限度的创造性’没有关系”。
因此,相较于美国,我国著作权制度对于AI自动生成内容的保护存在天然的优势。后续可以在修法过程中尝试论证,ChatGPT类产品生成内容邻接权保护模式的合理性与可行性。此外,当ChatGPT类产品生成内容在涉及B端企业用户和市场经营竞争时,能否通过《反不正当竞争法》“一般条款”涉及的“竞争利益”加以保护,也值得思考,虽然可能存在更严格的适用限制。
值得关注,英国早在《1988年版权、设计和专利法案》修订中,便已经对“计算机生成作品”(Computer-Generated Works)作出了规定,且目前看可以适用于AI自动生成内容的保护。该法案第9、12、79、178条做出了相应规定:“计算机生成作品是指没有人类作者的情形下,由计算机生成的作品”;“计算机生成作品的作者是操作必要程序,使作品得以产生的自然人”;“计算机生成作品的保护期限为50年”;“作者的精神权利不适用于计算机生成作品”

权利分配:

域外实践与既有判决倾向AI生成内容权利配置给用户

对于AI生成内容的归属问题,如果是AI辅助创作,使用人享有相关的权利应属无疑。对于ChatGPT等AI自动生成内容,从国外ChatGPT类产品的用户协议来看,大多数平台会通过合同约定将AI自动生成内容的权利配置给用户。例如OpenAI公司用户协议规定,“ChatGPT输出内容的相关权利归属于用户,用户在遵守服务条款后,可以出于任何目的使用输出内容”Midjourney在用户协议也约定,“用户对于使用服务生成的内容享有所有权,只要不违反现行法律的要求。”
但也有例外规定,比如Stable Diffusion Online则表示生成的内容将适用“CC0 1.0 通用协议”,即将生成内容投入“公有领域”,任何人都可以通过复制、修改、发行等方式利用,包括商业目的,无需获得事前授权。
从国内司法实践来看,在“菲林诉百度案”中法院倾向于将AI(机器)自动生成内容的相关权利分配给最终使用者。判决表示对于软件研发者来说,其利益可通过收取软件使用费用等方式获得,已经得到回报;且分析报告系软件使用者根据不同的使用需求、检索设置而产生的,软件研发者对其缺乏传播动力。软件使用者则通过付费使用进行了投入,基于自身需求设置关键词并生成了分析报告,并具有进一步使用软件以及传播分析报告的动力和预期。因此,从激励软件使用和内容传播角度,应当将分析报告的权益赋予用户。
著作权作为私有权利,在不违背法律规定的情况下,当事人可以自由约定内容的权利归属。而上述判决,从“最密切原则”——相关主体和生成内容的直接关联程度,“额头流汗原则”——相关主体对于生成内容的付出回报机制,“著作权制度初衷”——如何最大程度促进内容传播、公众内容的获取等角度考量,实质上更倾向于将ChatGPT等AI自动生成内容的原始权利配置给最终使用者。

权责一致:

ChatGPT类产品生成内容版权侵权的三方责任承担机制

目前ChatGPT类产品生成内容主要涉及三方主体:AIGC模型的研发者、AIGC模型的商业化应用者,以及最终使用AIGC模型生成内容的用户。这里我们首先需要明确的是,从技术角度看,当用户输入一段提示词,AI模型随机输出相应的文字或者图片,存在一定的侵权概率。此前有国外研究团队层指出:利用Stable Diffusion模型生成的内容与数据集作品相似度超过50%的可能性为1.88%。但对于输出内容是否实际侵权,述三方主体都不存在明确的预期,因为这一过程具有很大的随机性和不确定性。
根据“权利之所在,责任之所在”的基本原则,谁最终享有ChatGPT类产品生成内容的权利(不论是著作权亦或是邻接权等),谁便需要承担生成内容可能引发的版权侵权责任。如果约定由AIGC商业化应用平台享有生成内容的相关权利,平台需要承担直接的版权侵权责任;如果由用户享有生成内容的相关权利,用户则需要承担直接的版权侵权责任。从目前域外ChatGPT类产品平台用户协议可以看出,其在将内容权益配置给用户的同时,也均会明确表示用户对输出的内容承担全部的法律责任。
这里需要讨论的是,即使用户承担AI生成内容的直接侵权责任,AI模型的商业化应用者应当承担何种程度的责任?应当说,从ChatGPT类产品的实际运营来看,AI模型的商业化应用平台类似于一个新的网络服务类型。例如有观点便认为ChatGPT像是一个全新的搜索服务工具。因此,是否应当从版权保护注意义务的角度,为其匹配一个新的“避风港”责任机制,如同当年美国《数字千年版权法》设立的四种服务类型责任豁免制度一般,这值得思考。例如,如果ChatGPT类产品的商业化应用者尽到“侵权避免提示”“通知处理”等义务后,是否便可以豁免相应的间接侵权责任。
进一步思考,AI模型研发者对于生成内容涉及的侵权问题,是否需要承担责任?从侵权行为可预见性、侵权行为控制力以及侵权直接获益等角度评估,模型研发者相较于模型商业应用者和用户而言,与输出侵权内容的关联度更低、控制力更弱、经济利益更少。实际上,上游的AI模型本身或者相应的API接口作为一种通用技术或者服务,符合知识产权法中的“技术中立原则”或者说“实质性非侵权用途”:因为输出的内容具有不确定性,既可能侵权(小概率事件),更可能不侵权(大概率事件);并且对于下游模型商业应用者和最终用户的使用行为不具有实际的控制能力。因此,AI模型研发主体原则上无需对生成内容涉及的侵权问题担责。

未来展望:

ChatGPT类产品为内容创作领域人机协作范式奠定了重要基础

目前,AIGC正越来越多地适用于数字内容领域的创意性生成工作——在文学、绘画、影视等领域释放技术带来的新价值。在人机协作新范式之下,也需要我们不断思考所面临的版权新问题。
现实中,对于“ChatGPT生成文字”或者“Midjourney生成图片”,创作者们一方面可能会对其进行“改编”,增加包含自身独创性贡献的内容,进而形成了新的“改编作品”;另一方面也可能会对其进行“汇编”,在内容的选择或者编排上体现独创性,进而形成新的“汇编作品”。那么如何对上述新形成的内容进行属性认定?又该如何从权利角度保障创作者们的价值贡献值得思考。
未来,伴随ChatGPT类产品技术的持续发展完善,人机协作范式可能会成为内容创作领域的常态化实践。虽然从目前国内外案例来看,ChatGPT类产品输出的内容本身很难被直接认定为作品,但并不意味着人机协作下完成的内容在整体上无法受到版权法保护。
一方面,包含ChatGPT类产品生成材料的内容,若能够体现人类独创性的贡献,那么整体上便可以构成版权法上的作品;另一方面,版权法将只保护上述作品中人类创作的部分,并且这些部分“独立于”且“不影响”AI生成材料本身的法律属性判断。

上述思路源于美国版权局在2023年3月16日的最新指南,同时强调:“若希望注册包含ChatGPT类产品生成内容的作品,申请人不仅需要论证自身在整体作品中的创作性贡献,还需要标明作品中哪些内容(部分)是由人工智能所生成的,以备进一步的审核。” 

本文内容仅代表作者个人研究观点

参考资料来源:

[1]Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence,https://www.federalregister.gov/documents/2023/03/16/2023-05321/copyright-registration-guidance-works-containing-material-generated-by-artificial-intelligence.

[2]https://copyright.gov/docs/zarya-of-the-dawn.pdf

[3]ChatGPT类产品最终生成的内容形式各异,涵盖文字、图像、语音、视频等,但内容生成的机制相同:
用户根据自身需求,向ChatGPT或Midjourney的用户界面输入描述性的文本提示“prompt”,AI生成模型在对文本进行解码之后,匹配出此前数据训练阶段与之最相关的内容结果,然后进行对外输出.

[4]Based on the Office’s understanding of the generative AI technologies currently available, users do not exercise ultimate creative control over how such systems interpret prompts and generate material.[5]https://www.copyright.gov/rulings-filings/review-board/docs/a-recent-entrance-to-paradise.pdf
[6]2018)京0491民初239号;
(2019)京73民终2030号.
[7](2019)粤0305民初14010号.

[8]https://www.wipo.int/meetings/zh/doc_details.jsp?doc_id=499504.

[9]https://www.copyright.gov/rulings-filings/review-board/docs/2014-appeal-SampleFlocAnalyzerImage2014.pdf