​秦天雄    腾讯研究院高级研究员
 
当前和今后一段时期,我国发展仍然处于重要战略机遇期。 加快数字化发展,建设数字中国是这一时期的重要目标。 在实现这一目标过程中,激活数据要素潜能,加快建设数字经济、数字社会、数字政府,以数字化转型整体驱动生产方式、生活方式和治理方式变革成为实现目标的重要手段。
而数据产权问题,则成为其中最基础最核心的问题之一。

 

数据产权界定困境

2020年4月9日,中共中央、国务院发布《关于构建更加完善的要素市场化配置体制机制的意见》,提出要“研究根据数据性质完善产权性质”; 2021年3月11日通过的《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出“建立健全数据产权交易机制”; 紧接着3月15日召开的中央财经委员会第九次会议也提出要“加强数据产权制度建设”。

党中央的多个文件、会议都将完善数据产权制度作为加快培育数据要素市场、营造良好数字生态的重要任务。 2021年两会期间,多名代表委员也提出了明确数据产权的建议和提案。 这表明,我国正迫切需要地对数据产权界定方法进行创新性的探索。 然而,数据产权最核心的问题就在于产权难以界定清楚。

数据产权界定不清带来很多问题。

首先,数据产权作为数据综合治理体系的重要一环,其界定不清会导致与之相关的数据流通、数据交易等制度缺乏基础; 而其他制度迟滞不前也难以反哺数据产权界定工作。

其次,数据产权界定涉及多方利益主体,各方主体之间既共生互赢,又存在利益冲突,数据产权界定不清,加剧了数据上利益主体之间的冲突。 例如: 如何既满足个人对个人数据保护的诉求,又实现企业对于数据的利用,同时满足国家基于国家安全需要对数据活动实施管理,对此目前还未找到较为有效的解决出路。

最后,数据产权界定天然具有追求规则稳定性和利益可期待性的特点,然而数据可能被何人使用何种技术用于何种情形又具有或然性,无法准确预料,过宽或过窄地对数据产权进行界定,即使一时有了稳定的数据产权界定规则,但如果无法保障灵活性,则会很快过时,从而无法消除特定利益主体对其利益诉求能否实现的担忧。

数据产权界定困境归因

(一)数据特性复杂

数据的复杂性是数据产权界定难的重要原因。 数据作为数据法律关系的客体,其所引发的社会关系尚处于形成和发展阶段,未充分暴露其本质特征,需长期观察,目前的认识还不全面。 有学者将数据特性归纳为: 混合性、复杂性、不确定性、多栖性、特殊的稀缺性、低智力性、隐私性等。 本文将数据特性的复杂性归纳为五点。

数据客体具有独特性。 一是数据很难归入传统法律关系客体中,比如物、行为、智利成果、工商业标记等均难以将数据完全归入其中。 二是数据的特性与技术高度关联,技术是认识数据特性的重要变量。 一般而言,技术不会对如木桌、铁椅等物产生影响,然而却很可能对数据造成影响,改变法律评价。 数据与算法、算力深入结合不断产生新功能新价值新趋势,如何对其研判和评估非常艰难。 三是数据也不同于“土地、资本、技术”等传统生产要素,其既是生产要素,同时也映射了社会关系,这使得对于数据的利用会产生相关的外部性问题。 数据客体的独特性是数据特性复杂的底色,对其认识评估具有长期性。

数据概念内涵多样。 数据概念的内涵和外延多样,在不同场景具有不同含义。 现行立法和文件对数据内涵大致有五种理解: 一是通过观察、实验或计算得出的数量化资料,表现为数值; 二是电磁环境下信息传输的一种表现方式,表现为“0,1”; 三是电磁环境下以数据方式传输或者处理的信息,即将“数据”与“信息”混用; 四是大数据处理技术广泛应用背景下,处理和看待事物的一种角度或者方法; 五是指任何以电子或者非电子形式对信息的记录,包括网络数据和非网络数据。 要确保在同一概念体系下讨论数据产权问题,数据概念以采第五种适宜。

数据内容组合多样属性多变。 数据与一般客体不同,任意两个以上元数据均可组成数据集,规模不同、性质不一的数据集均可统称为数据。 极强的组合多样性导致不同组合的数据可能具有几乎完全相反的特性,对其不得不拆分、归类。 比如: 处理个人数据一般而言要告知同意,但处理非个人数据则不用。 再比如,个人数据、企业数据、行业数据、公共数据和政府数据均具有不同特性,但当个人数据、企业数据被政府机关收集、汇总、加工而变成政务数据时,则面临是否以及如何被公开共享的问题。 不区分具体场景,而欲对数据内容准确理解者几无可能。

数据形态具有不断流动性的特点。 数据不同于静止不动的物,其作为生产要素参与社会生产过程,需在系统间、网络区域间、组织间、主体间流动。 数据流动是实现价值的前提和基础,也给数据产权界定的灵活性、适应性提出了更高的要求,迫使数据产权制度的建设需具备动态界定的效果。

数据价值具有增益性。 数据不同于使用价值一般会逐渐降低的物品。 在大数据时代之前,数据价值增益性的特点并不突出; 随着数据处理技术的发展,在已有数据之上可以挖掘出更多信息,生成新的数据产品,形成新的数据业务,通过数据流动使数据价值不断变动,并出现价值增益现象。 价值增益与产权界定密切关联,对于产权界定的公平性和效率性都提出了更高要求。

(二)数据上利益主体诉求多样

首先,在数字经济发展过程中,个人、企业、行业、产业、社会、国家甚至整个人类命运共同体对数据均存在不同的利益诉求,具有很大的复杂性甚至冲突性。 如个人对个人数据具有控制、访问、更正和删除等诉求; 企业对数据具有充分利用的诉求; 社会对数据具有流通的诉求; 产业对数据具有共享的诉求; 国家对数据具有政治安全的诉求等; 但保护个人对其个人数据的控制在某种程度上与社会对数据自由获取和传播存在冲突。 同时,不同主体对相同的数据上的利益也可能不同。 比如个人、企业、产业、行业、社会、国家等可能均对某一数据具有利益诉求,也可能只有部分主体具有利益诉求,这些利益可能存在近似之处,但更多体现了不一致性。

其次,在数据产生和流动过程中,数据行为链可能会涉及多个主体,但具体涉及多少类主体难以完全提前预判,具有多元性和不确定性。 比如就特定个人信息的流转而言,其可能涉及多个个人、多个企业、多个政府机关,也可能只涉及其中之一。

最后,对数据上利益的诉求及社会认知并非固定,反而会随着社会发展和社会认知的调整不断变化。 比如就个人数据而言,现在更多认为“个人信息不仅关涉个人利益,而且关涉他人和整个社会利益,个人信息具有公共性和社会性”,“个人信息本身只是一种可以识别某个人的事实或记录,并不当然地应该由个人拥有或控制,也不足以使个人对该数据具有支配利益”。

总之,数据上利益主体诉求多样,在界定数据产权的时候需要摈弃“一刀切”的幻想,充分考虑不同主体在不同场景下利益诉求的不一致性,而后综合多种因素进行界分。

(三)界定数据产权的方法存在不足

目前没有权威、公认的界定数据产权的方法,理论层面存在多项探索。 本文重点就媒体报道和学术研究中常提及的确定数据权属的方法进行分析,指出其优点及不足。

确定数据权属方法的核心特点是试图通过解决数据归属问题,实现界分数据产权的目的。 在此背景下,有学者进一步将数据产权分为数据所有权、支配权、使用权、收益权、转让权、处置权、数据隐私权和数据许可权等。 其优点是借用物权法律思维,使用与大众日常生活距离更近的所有权概念,较易理解,有利于推动大众对数据价值的认识,而且,随着区块链技术的发展,部分数据物权化的特点逐步显现,更体现了将特定数据作为所有权客体的可能性。

然而,数据权属归谁所有,理论界至今也争论不休,归纳起来有四类: 数据属于个人、数据属于平台、数据属于个人与平台共有、数据属于公众。 随着对数据性质、数字经济发展规律进一步理解,数据权属方法的不足进一步凸显:

首先,界定权属不能完全解决对数据的控制问题,很多情况下即使赋予所有权,权利人也无法真正实现对数据的控制。 如就个人数据而言,“数据所有权与基于权益的个人数据保护方法不相容。 数据所有权既不能解决数据不平等问题,也不能赋予个人控制数据使用的权利”,更有学者指出“在基本权利或宪法权利层面个人对个人数据的自决权或控制权,不能理解为个人对个人数据的全面的、绝对的支配权”。

其次,界定权属的方式不够有包容性,难以够适应数据组合多样、性质多变的特点,“数据之上难以一刀切地设立所有权等绝对性权利”。 换句话说,界定权属的方式只能在少量的场景能够适用,数据在不同分析技术、不同应用场景下所呈现的利益具有动态性且不相同,需要新的界分产权的方式。

最后,界定权属的方式可操作性不够,在更多场景下确定数据权属十分困难,无法将权属简单归于单一的主体,不能较好界定数据上共存各方的利益分配。 实际上,数据权属的提法在一些情况下只是个人对加强数据控制愿望的一种投射,缺乏界分数据产权的实际意义。 比如,有学者对此分析道,“拥有数据所有权,就成为一种具有解放性的、强化隐私的举措”。

场景化方式:一种界分数据产权的新方式

目前,从国内外实践看,均无较好的办法对数据产权进行有效界定。 通过“著作权、数据库权、商业秘密保护、合同机制等既有框架虽然能为数据主体之间的行为提供一定规范作用,但各有其不足”。 “数据处理流程中存在许多单独的行为,这些行为催生了大相径庭的价值观和忧虑,需要截然不同的方法和解决方案”。 “

即使在国际层面上以法律方式阐释了数据所有权,还是会产生一个问题,即一个有着数据所有权的数据所有者能获得哪些权利”。 据此,本文提出了一种界分数据产权的新方式。

(一)场景化方式的具体内涵

场景化方式,在方法论上,没有把确定数据权属、数据所有权作为解决数据产权问题的前提和目标,也非以“弥补人格权保护模式的虚置”为方向,而是将数据产权的核心抽象为数据上利益,以场景化方式为核心手段,从区分数据上利益的角度对数据产权进行界分,在界分中不断从特殊性中归纳普遍性,既摆脱数据产权理论上肯定论和否定论的学理争执,又摆脱数据产权分配“非此即彼”的思维束缚,针对不同主体需求,不同数据利用场景,采取分步骤、分阶段、分类分级的方法,动态研判数据上利益分配方案。 在界分结果上,可以是赋予特定数据以数据权属或者数据所有权,但更多的是在不同场景下明确各方主体的具体行为规范。

(二)场景化方式的突出优点

首先,场景化方式与数据特性变化多端、数据治理处在初步阶段、从现象到本质的认识规律等相符。

其次,场景化方式给予了数据上利益各方在不同场景下充分实现利益诉求的机会,不武断地排除或者忽略某一方对数据享有的合理利益诉求,给予了个人、企业、行业、产业、社会、国家甚至整个人类命运共同体等多元利益主体在具体场景中细化权益诉求的公平机会,提高了各方参与数据治理的积极性。

再次,与确定数据权属等方法相比更有包容性,不仅体现在时间上、空间上可以涵盖更多场景,而且在保护方式上也可以涵盖公法、私法两种方式。 例如,有学者针对数据隐私上的利益提出“保护数据隐私不应当期待可以寻求某种客观的权利边界,而应当更多采取风险规制的公法框架与尊重预期的消费者法框架,通过这两个框架来界定相关权利的边界”。

最后,场景化方式在界定了具体场景下各方利益的同时,也打开了与数据流通、数据交易等其他数据相关制度协同发展、相互反哺的阀门。

(三)场景化方式的实践探索

1.部分立法已采用了场景化的思路,与场景化方式相契合。

比如: 民法典重点对保护个人信息这一场景设定了不同的行为规范。 个人信息主体的利益诉求主要是可控性,所以要求处理个人信息的行为人,应当遵循合法、正当、必要原则,不得过度处理,并符合五个条件 (民法典第1035条) ; 信息处理者的利益诉求主要是免予承担责任,所以规定了信息处理者处理个人信息免责的三种情形 (民法典第1036条)

网络安全法重点对网络运营者的网络信息安全保障义务进行了规定。 例如,在用户个人信息的保存场景下,用户的利益诉求主要是安全存储,所以要求网络运营者不得泄露、篡改、毁损其收集的个人信息 (网络安全法第42条)

数据安全法重点对数据处理者的安全保障义务进行了规定。 例如,在数据安全涉及国家安全的场景下,国家的利益诉求是国家安全,所以要求在开展影响或者可能影响国家安全的数据活动的场景下,对数据进行国家安全审查 (数据安全法第24条) ; 而在与履行国际义务或者维护国家安全相关的数据出口的场景下,要求对属于管制物项的数据依法实施出口管制 (数据安全法第25条)

个人信息保护法重点对个人信息进行保护,对个人信息处理全流程多个场景下的利益分配进行了规定。 例如,个人信息委托处理场景下,基于各方不同利益诉求规定了委托方、受托方不同义务。 要求委托方与受托方约定委托处理的目的、处理方式、个人信息的种类、保护措施以及双方的权利和义务等,并对受托方的个人信息处理活动进行监督。 要求受托方按照约定处理个人信息,不得超出约定的处理目的、处理方式等处理个人信息,并应当在合同履行完毕或者委托关系解除后,将个人信息返还个人信息处理者或者予以删除,以及未经个人信息处理者同意,受托方不得转委托他人处理个人信息等。

2020年7月15日《深圳经济特区数据条例 (征求意见稿) 》第五条曾规定: 深圳市人民政府探索完善数据产权和隐私保护机制。 但12月28日的审议稿中删除了这一规定,同时也把此前提出的“数据权”修改为“数据权益”。 其场景化构建数据上利益保护体系主要体现在三方面:

一是在总则中规定,“自然人、法人和非法人组织依据本条例享有对特定数据的自主决定、控制、处理、收益和利益损害受偿等数据权益。 ”

二是在数据开发利用过程中,严格规范个人数据收集、处理等数据行为,实现对自然人数据尤其是涉及隐私数据的保护。

三是通过确立数据安全管理规范,解决数据收集、数据处理、数据共享、数据开放、数据销毁等数据全生命周期中可能产生的数据安全问题,实现对自然人数据以及企业商业秘密的保护。

2.其他场景化方式的探索。

实践中如何在具体的场景下切分数据产权存在不同的探索,比如近年来司法实践逐步明确了企业对其投入劳动,收集、加工、整理的数据产品享有财产性权益,依法获取的各类数据基础上开发的数据衍生产品及数据平台等财产权益受到法律保护。

比如在企业数据上利益界分的场景中,有学者提出了从类型化与场景化的角度,对不同企业数据分别提供商业秘密保护、类似欧盟数据库特殊权利保护或者竞争法的保护的观点。 同时理论上也在探索对一些数据赋予所有权,纳入物权制度。 例如,有观点认为,利用加密技术获得的非可替代通证 (non-fungible to⁃ken,简称NFT) ,具有独一无二的特点,这类区块链数字资产符合物权特征,应纳入物权保护体系。 权利人对其区块链数字资产享有所有权,包括占有、使用、收益、处分等。 物权的排他、优先、追及、请求权等效力也应适用于区块链数字资产。 还有其他有关场景化的探索,鉴于文章篇幅本文不再赘述。

场景化方式界分数据产权的原则和路径

(一)场景化方式界分数据产权的原则

场景化方式界分数据产权应当坚持合法、公平、效率和衡平原则。 其中合法原则,指界分数据产权应当符合法律法规的规定。 界分数据产权涉及数据上各方的核心利益,应当由法律法规作出规定,在法律规范没有明确规定的情况下,可以依据法律原则和法律原理进行探索。

公平原则 ,指在数据产权制度设计上应当给予数据上利益的各类主体之间、同一类主体内部不同主体之间从数据中获益的公平机会,确保各方对数据的诉求可以被公平、充分地考虑,对数据所产生的收益能得到公平分享。 只有最大限度地争取数据治理生态系统中所有参与者的支持,包括全社会的支持,不断提高数据治理的社会包容性和透明度,数据上利益分配会更流畅,数据价值更易得到发挥。

效率原则 ,指在数据产权制度设计上应当注重发挥数据的价值,提高分配效率,避免久拖不决。 《2021年世界发展报告:让数据创造更好生活》也指出“当今数据的空前增长和无所不在显示着数据革命正在改变世界。 然而,数据的价值仍有很大开发空间。 为某一目的收集的数据有可能通过其他应用产生远超初衷的经济和社会价值。 但数据利用还面临许多障碍,从激励机制错位、数据系统不兼容,到基本的信任缺失”。 只有提高数据利用效率,才能更大程度拉升数据对促进数字经济高质量发展,对培育数据要素市场的作用。

衡平原则 ,指在数据产权制度设计上应当处理好数据利用与数据安全的关系,在追求数据利用价值最大化的同时,将公共领域和私人领域的数据安全风险最小化。 具体而言,包括处理好“数字技术和数字市场的发展与创新; 消费者权益保护尤其是个人数据和隐私保护; 商业利益; 以及公共利益和国家利益”等之间的平衡。 保护个人数据时受比例原则的限制,在涉及个人数据保护时不能枉顾商业利益和公共利益而走向绝对化,企业对个人数据的获取及使用也不能以牺牲个人隐私为代价。 总之,要避免过度重视对某一方利益,忽略其他方利益。

(二)场景化方式界分数据产权的路径

在上述原则的基础上,下文提出场景化方式界分数据产权五点路径:

1.完善数据产权法律制度建设。

民法典第127条规定,“法律对数据、网络虚拟财产的保护有规定的,依照其规定”。 该条宣誓了“数据必须立法”的使命。 2021年3月29日公布的《安徽省大数据发展条例》在第三十八条规定: “省人民政府数据资源主管部门应当会同有关部门统筹大数据交易服务机构的设立,搭建数据要素交易平台,建立数据产权交易机制,推动建立行业自律机制”,在国内立法中首次提出“数据产权”,但颗粒度相对较粗,不够细化,建议继续完善数据产权法律制度建设,通过完善数据产权法律制度进一步明确数据上利益各方的法律地位,提高法律的确定性和可预测性,增强市场主体对数据上利益的可期待性,增强市场信心。

2.从权利束的角度公平地对数据上利益进行分配。

正义即是给每个人以其所应得,数据上利益的贡献主体多样,均有获得数据上利益的诉求和正当性。 数据上集结的权利内容也并非单一的某项权利,而是包含了各种各样的权利和利益,建议对这些权利和利益进行细化和归纳,基于数据体现的不同特点,赋予不同主体对数据不同的利益,同时把付出程度或者贡献程度作为分配数据利益的重要角度。 例如,企业是推动当前数据经济发展的重要力量,“就数据资源而言,数据的收集、清洗、分析、利用等所有环节都离不开算法,企业在数据资源的形成和开发中必然要投入大量的人力资本和物力资本”。 但企业投入数据经济的意愿和努力,最终取决于企业数据能够得到充分、合理和有效的法律保护。 建议对于企业投入大量劳动进行大数据开发并形成数据集、数据库等数据成果时予以保护。

3.鼓励创新,促进数据上利益分配效率,平衡个人信息的保护要求与技术创新和产业发展要求。

创新是经济发展的驱动力。 数字经济时代下,创新已从个人创新走向了集体创新,企业是创新主体。 在大数据行业,从硬件、软件到技术、算法再到数据服务商,形成了完整的产业链。 企业在提供服务的过程中收集了大量的数据,并开始在数据利用方面进行探索。 对数据进行合法收集、融合、清洗、加工、挖掘、分析、可视化等行为,并形成可以帮助决策的大数据成果,正成为促进产业发展的核心能力,也成为参与国际竞争的关键竞争力。 利益分配制度要更加效率,给企业以充分激励,不断激发企业活力、激发企业在数字经济中不断创新探索,也要在个人信息主体保护与产业发展、企业数据利益保护等各方主体之间取得平衡,避免照搬域外对个人信息的过度保护的立法。

4.在数据治理中更多采用对数据控制者制定行为规范来实现法益保护。

数据不同于传统有形物的特点,使得单纯类比有形物的物权制度进而采取数据权属的财产性制度,在对数据上利益进行分配时存在诸多不适应之处。 建议减弱财产权规范范式的权重,更多使用改用责任规则而来保护数据。 通过对数据使用人的行为规范来避免数据滥用行为对个人权益的侵害,通过对违法行为的惩治来实现对数据的保护。 在对个人利益、企业利益、产业利益、社会公共利益、国家利益进行平衡判断的基础上,区分数据种类、结合使用场景和方式作为详细规范。 通过细化对具体数据处理行为的规制,分配数据上的利益; 通过不断积累对数据上利益的分配经验,并逐步在法律中固化,逐步形成适应我国国情的数据产权制度。

5.加强国际数据合作提高信任水平。

与其他民商事法律制度相似,数据治理具有很强的国际化诉求。 在构建数据治理的国内体系的同时,建议继续推动数据治理国际体系建设。 在《全球数据安全倡议》和《中阿数据安全合作倡议》的基础上,通过不断开展国际合作,在双边、地区和全球层面加强法规和政策协调,不断强化信任机制建设,提高数据合作水平,通过构建国际化数据合作平台,提高对数据产权认同程度,实现数据安全有序流通。

结  语

界分数据产权的实质是对数据上利益进行分配。 本文对数据产权界定困境、产生的负面影响以及原因进行了分析,指出数据特性复杂、数据上利益主体诉求多元以及界定方法不足是数据产权界定难的重要原因。 在此基础上,提出了用场景化方式界分数据产权的观点,并就这一观点的具体内涵、突出优点和实践探索进行了介绍,最后全面论述了使用场景化方式应坚持合法、公平、效率、衡平四项原则; 并提出了场景化方式解决数据上利益分配的五点路径建议,包括: 完善数据产权法律制度建设; 从权利保护的角度对数据上利益进行公平分配; 鼓励创新,促进数据上利益分配效率,平衡个人信息的保护要求与技术创新和产业发展要求; 更多采用对数据控制者制定行为规范的方式来实现对法益的保护; 加强国际数据合作提高信任水平。

“社会不是以法律为基础的。 那是法学家们的幻想。 相反地,法律应当以社会为基础”。 数据产权问题是释放数据红利的重要准备,也是加快培育数据要素市场、营造良好数字生态的重要任务。 通信技术、数字化技术、数据分析、数据应用的快速发展会给数据产权的界定带来更多变量,数据产权界定工作具有长期性艰巨性复杂性的特征,对数据产权的思考应该在更加开放、更加务实的基础上积累更多素材,为通过法律规范确定数据产权提供更充分的实践基础和实务经验。 

本文首发于《上海法学研究》集刊2021年第6卷(新兴权利与法治中国文集),原标题《对场景化界定数据产权的思考》。 为了便于排版,暂略去注释,如需引用请参考原文。