当下,数字经济在国家层面被摆到了前所未有的高度,而产业互联网的进程恰恰就是产业数字化的进程,在此过程中产生的海量数据是真正的宝藏。大数据意味着大生意,随着数据的资产化,其所带来的价值将超越我们的想象,堪称21世纪的石油。如果说,互联网上半场的竞争本质上是对流量的争夺,那么,互联网下半场的博弈从某种程度上也可以理解成是对数据的竞争。

 

一、“数据产权”缘何重要?

进入互联网时代,由于摩尔定律(处理器的性能每隔18个月就会翻番)的作用,产生了海量的数据。但为什么近年来大家才普遍关注数据以及数据产权?

经济学家哈罗德·德姆塞茨(Harold Demsetz)在其发表的论文《论产权理论》(Towarda Theory of Property Rights)中提到:产权的产生,本质上还是一个成本收益权衡的过程,只有当通过界定产权,将外部性内部化的收益大于从事这一行为的成本时,产权才会产生。简言之,当确定数据产权的收益大于确定数据产权的成本时,数据就有了确权的经济基础。

再往深层看,之所以确定数据产权的收益会变大,主要原因是数据的价值日益凸显,其稀缺性渐显,并因而具有了财产属性,甚至成为了生产要素。

当下,数据既可以成为产业互联网的助力器,也可以成为产业互联网的拦路虎。现在有不少企业已经不乐意将自己的数据共享给其他企业,或者选择自建数据体系,其原因在于权属不清容易产生纠纷,或者权益被侵犯、想维权却担心无法可依。不确定的数据产权给各方在数据的开发利用环节带来了不可控的风险成本。由此,亟需通过立法确定数据产权以促进各方合作。正如雷布斯定理所昭示的,应通过构建法律,使私人之间由于协调失败所造成的损失达到最小。当下种种现实,均指向确定数据产权的条件已经成熟或趋于成熟,数据的收集、挖掘、开发、利用、共享与交易等环节都绕不开对数据产权的认定。
此外,对于立法、司法机关来说,当新生事物在现有法律体系下难以找到合适制度来保护时,不妨尝试用数据产权来解决。比如在菲林律所与百度AI“作品”著作权一案中,AI生成物能否成为著作权法意义上的作品引起了极大争议,如果认为不能,则一些高品质的AI生成物将面临无法可保的状态,这将极大挫伤人工智能产业的发展。对此,不妨将AI生成物归为数据,并以数据产权保护之,这样就避免了AI生成物是“思考”的产物,还是“运转”的结果的争论,因为AI生成物本质上就是一种数据。
二、数据产权的配比之争

近年来,企业间数据纠纷呈井喷之势,菜鸟与顺丰分歧、淘宝与美景案、微博与脉脉案、Facebook与Power公司案、HiQ与LinkedIn案、大众点评与百度案等,本质上无不是数据之争,这也代表了企业间的数据竞争已经公开化

与之相对的是在整个数据周期中,“数据的权属到底是属于个人的,还是企业的,亦或是其他单位的”,每个主体对于数据天然地都会有自己的权利主张,但该类问题却往往被大家所忽视,而实际上,数据产权才是打开大数据时代的开门钥匙。如果以数据为原点,那企业间的数据争夺就可以看作是数据的横向竞争,而对于数据产权在不同数据主体之间的分配诉求则可以看成是数据的纵向竞争。当下,横向竞争无疑已经白热化,并且吸引了足够的关注度,但数据产权作为数据应用的底层基石,理应更值得被深入了解。数据产权作为权利束(A Bundle of Rights),包含使用权、收益权、占有权与处分权,甚至还包含可携带权与被遗忘权等。

数据产权主体既可能包含个人用户、数据收集企业、平台企业,也可能包含政府机构与数据中介等组织。在这里,用产权来分析数据权属更具有现实意义,必须指出,如果用现有的物权所有权制度或知识产权制度去套用数据产权归属,恐怕不可行,因为数据与实体物具有完全不同的属性,与知识产权也不尽相同。相比之下,数据具有如下特性:

1. 混合性:很多数据无法明确分割开来,可能是由上亿个不同主体产生;

2. 复杂性:数据的形成可能需要经过好几轮不同主体的产生与处理;

3. 不确定性:如何使用数据在形成数据的时候往往并不明确,后期通常还会进行层层挖掘,因此数据的价值也很难被标准量化;

4. 多栖性:因为数据方便复制携带,所以数据可以同时存在不同的介质中;

5. 特殊的稀缺性:数据存在无形性,且理论上可无限复制,并且复制品与“原物”的价值等同,所以数据的稀缺性与通常所讲的资源稀缺性存在明显区别,数据的稀缺性往往体现在获取及控制使用上,而不是数据本身具有很高的直接价值,单个数据往往不具有直接的经济价值。

6. 低智力性:数据往往是反应某种客观现象,因此通常不具有独创性或创造性;

7. 隐私性:有些能够识别特定个人的数据往往具有隐私性,这也是大家觉得数据很敏感的根本原因。

基于以上特性,数据产权的认定比之前任何权利的认定显得更加复杂与棘手,我们应当允许数据产权可以分别在多个主体之间共存,径直套用“一物一权”或“登记公示”制度显然是不负责任的行为。数据产权的终极形式虽然是由法律以明文规定下来,但如果仅从法理分析不仅过于片面,并且容易脱离实际,所以,本文将从经济角度、公平角度与现实角度三个维度探索数据产权的配比之争。

1.经济角度:效率优先

从经济角度看,数据产权在个人、企业、平台、政府及其他组织等不同主体之间的初始配比将影响数据资源的最终配置效率。

科斯定理(Coase theorem)指出:

定理I:在交易费用为零的情况下,不管产权如何进行初始配比,通过当事人之间的市场交易,都会导致资源配置达到最优状况(帕雷托最优)。

定理II:在交易费用不为零的情况下,不同的产权初始配比会带来不同的资源配置效率。

我们都知道,现实中的交易费用不可能为零,所以科斯定理I更多起理论指导作用。但可以从科斯定理II得出,产权的配比最终将会影响资源配置的效率。

假设一个人的数据仅由他自己掌握并使用,那这些数据的价值几乎可以忽略不计,效率也极低;而如果把大量个体的数据都集中到某些数据企业,最后汇总到平台企业,当数量达到千亿及以上级别,那这些数据所具备的价值将不可估量,并且可以综合运用大数据、人工智能等科技手段,使得效率、价值极大提升。

因此,我们可以得出,数据产权越向大体量级别的主体集中,所产生的价值越大,效率也越高。

但是,科斯定理即使作为经济产权领域的经典理论,其本身也具有明显的局限性。片面追求资源配置效率以及较强的理论性,导致不同人据此得出的结论可能截然相反,比如判断是否真的达到最优状态(帕雷托最优)本身就具有极大争议。

2.公平角度:公正合理优先

当我们从经济角度出发,可以看出,如果只追求效率,法律应该把数据产权划给平台企业。但我们知道,法律兼顾效率与公平,并且在绝大多数时候,公平总是排在首位。但如果把数据产权全部划给个人,显然也违背了一般经济规律,因为前文已经探讨了平台拥有数据产权的经济基础。具体到谁的付出更大,谁的贡献更大,不同主体在不同的立场上得出的结论可能完全不同。在讨论公平之前,我们有必要分析数据的形成过程。以一个数据生命周期为例,我们着重关注:个人产生数据–企业收集数据–平台脱敏(匿名化)建模数据。

根据“额头出汗”原则(谁有付出,谁就拥有相关权利),在形成过程中对数据产权的认定上,三者均有参与并付出努力,产权单纯划给某个主体都无法解决公平问题。虽然我们还无法直接得出每个主体的具体贡献比,但从这个角度出发,论证了数据产权在不同主体之间共存的合理性。

3. 现实角度:平衡效率与公平

一部好的法律必须准确并尽可能早的反映社会经济发展关系。尽管法律属于上层建筑,但不妨碍法律服务于经济的特性。如果仅按效率将产权划分给平台企业,虽然在现有存量下,资源配置效率最优,但这必然导致个人消极甚至抗拒产生数据,阻碍可持续发展,这也是科斯定理的局限性所在;如果仅按公平原则划分,可能会僵化数据并影响利用效率与社会公共利益。所以兼顾效率与公平是数据产权得以落到法律层面的必然出路,事实上,每部法律几乎都是公平与效率妥协的产物。

对此,我们可以尝试提出如下数据产权分配模型“三步法”:

针对第一步:在淘宝与美景不正当竞争一案中,法院认为,单个用户的数据本身并不具有直接的经济价值,在无法律规定或合同特别约定的情况下,网络用户对于其提供于网络运营者的单个用户信息尚无独立的财产权或财产性权益可言。其实,评判一个“物品”是否具有财产性权益,不能仅仅着眼于是否具有直接经济价值。很多“物品”可能本身并不具备直接经济价值,但经过一定转化,便可以产生惊人的经济价值。

现在经过算法推荐的精准营销已经颇为成熟,即使是单个用户的数据,经过分析后也可以向其推荐符合其心意的商品,相较于之前的“硬推”,精准营销拥有更大的成交概率;此外,有位外国小伙曾在网上公开拍卖自己的个人信息,最终由一家公司以几百美金拍得;欧盟GDPR中也规定了个人用户(数据主体)具有数据可携带权,如果不承认数据的财产属性,那上述情形也就很难得到合理解释。

所以,个人用户是否拥有底层数据的产权,争论已不在于底层数据是否具有财产属性,而在于底层数据具有极强的人身属性,如果产权属于企业,在现有《网络安全法》的个人信息保护制度下,企业对该部分数据也难以有实际作为,况且这还会影响到产品的用户体验(用户感知与实际使用),并且数据生产环节长久以往也会萎靡,最终会妨碍数字产业的可持续发展。其实,在我看来,企业真正看中的是应该是底层数据的使用价值,其他倒是次要的。

尽管如此,个人用户的数据产权应当是受限的,甚至是不完整的。正如前文所说,现在的数据犬牙交错,具有混合性,如果用户随意行使其权利,将给企业经营带来不可控的风险,打乱了可信赖的服务体系,将使企业无所适从。个人行使相关权利时,除了基于公共利益的考虑,也应当考虑相对主体操作的可行性、必要性及经济性等,企业在合理范围类,有权拒绝用户的相应请求,适当提高用户对个人数据自主性的门槛,有利于整个行业秩序的安定,也更符合实际情况,不至于使法律束之楼阁。

针对第二步:这些集合数据虽然本质上是个人数据的集合体,不过收集、管理与储存这些数据需要付出相当的成本,所以收集企业理应享有使用权,这体现了公平原则。

但也应当对企业的使用权作出限制性规定,比如禁止滥用、故意损害用户利益及安全保障等行为,不然可能会导致用户数据泄漏、滥用与失去信任等灾难性事件频发。当然,企业可以依据用户协议约定使用的具体方式、范围等,在合法的情况下尽量“扩充”自己的使用权。用户是否愿意以隐私换取便利引起了社会的广泛关注与讨论,其实,这种争论是无效的,因为谁也没办法代表谁,应该把决定权交还到用户手中。具体体现在上文提到的“用户协议”,只要用户同意“用户协议”,即视为其对自己的相应权利作出让渡,企业可以依据“用户协议”放心展开经营,而不是签了“用户协议”还要提心吊胆,只要法律无明文禁止,就应当允许企业展开一些探索性的尝试,否则社会发展无从谈起。

其实在数据利用这方面,政府整体是走在前头的,前阵子刚好参加了《上海市公共数据开放管理办法(草案)》的一次立法研讨会,从草案中可以明显感觉到政府对于公共数据开放的乐观态度,即使在数据产权还未有明确立法之前,公共数据开放利用已经先行先试,其实这不难理解,因为法律总是滞后的。

现如今,大家谈隐私色变,其实对于那些真正想要给用户带来更好体验的企业,法律政策应当给予解压松绑,这类企业往往是数据发展的积极探索者,而不是一心想着去钻规则的漏洞,事实证明,这类企业往往会给社会带来普世性的便捷服务,如网约车市场;而那些只想靠贩卖隐私、个人信息发财的“无良商家”,才是法律政策真正要打击的对象。

针对第三步:《网络安全法》似乎也为脱敏建模数据产权属于处理平台留了口子,其第四十二条规定:“网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。

反过来理解这个法规,是不是也可以得出,如果是经处理无法识别特定个人的信息,网络运营者可以自行处置该信息,包括有偿提供。“网络大数据产品不同于原始网络数据,其提供的数据内容虽然同样源于网络用户信息,但经过网络运营者大量的智力劳动成果投入,经过深度开发与系统整合,最终呈现给消费者的数据内容,已独立于网络用户信息、原始网络数据之外,是与网络用户信息、原始网络数据无直接对应关系的衍生数据。网络运营者对于其开发的大数据产品,应当享有自己独立的财产性权益。”这是杭州铁路运输法院(杭州互联网法院)在淘宝诉美景案中的观点,二者不谋而合。

随着数据产权的觉醒,数据产权配比之争还会加剧,诸如朱烨诉百度隐私权纠和重庆博士诉抖音隐私权纠纷的案件还会层出不穷,由于目前没有数据产权制度的安排,所以对于此类纠纷,个人与企业之间一般围绕隐私权,企业间一般围绕不正当竞争展开争辩,这非常考验或者说依赖法院的“平衡艺术”。

不管法律最终如何界定数据产权的边界,都无法避开各方对数据产权配比的诉求,这便是数据的纵向竞争。其实不管是横向还是纵向竞争,均属正常现象,数据竞争并不是一场零和博弈,竞争带来思考,带来迭代,带来未来,没有竞争才可怕。

 

三、结语

对于企业来说,数据作为企业未来的核心资产,争夺已经公开化,企业一方面要加大法务资源、数据人才的投入,另一方面,有条件的企业要积极参与立法,争取将自身的合理诉求反映到立法层面。因为未来数据之争只会有增无减,最好的方式就是在源头上下足功夫。而对个人用户来说,平衡便利与隐私是其首先要抉择的问题。目前,最有效的方式就是认真阅读“用户协议(泛含隐私政策)”,而不仅是“程序性”同意。

互联网下半场刚开始,产业互联网将会把我们带入一个全数字时代,而开启这个时代的法律钥匙就是确定的数据产权,可以预见,一旦数据产权认定完毕,市场这台机器将会马不停蹄地对数据进行全方位的开发利用,使得数据真正成为像石油那样的生产资料。

 

参考文献

1.《中国互联网络发展状况统计报告》,中国互联网络信息中心,2019.2

2.《中国大数据发展调查报告》,中国信息通信研究院,2018.4

3.《数据产权应划归平台企业还是消费者?》,陈永伟,北京大学市场与网络经济研究中心

4.《数据竞争的法律制度基础》,丁文联,财经问题研究,2018