牛津大学互联网研究院主任Luciano Floridi

大数据、小模式、深影响


      我今天想跟大家分享的是大数据以及大数据所延伸出来的商业价值。

      可能有些人会问这样的问题,我所代表的学院——牛津大学互联网研究院的主要工作职责是什么?我想说,我本身是牛津大学信息哲学与信息伦理学的教授,能在这里和大家一起见证腾讯互联网与社会研究院的成立,是一件非常了不起的事情。因为我认为人类开发数据技术是多年来在古老地球上开出的一朵鲜艳的花。其实这个技术在很多年前就已经有了,它深深根植于我们的生活中,它就是哲学。

      哲学是土壤,土壤与花朵的健康成长密不可分,所以我今天讨论的内容就是如果你认为自己是一朵鲜花,就一定要照顾好你的土壤;如果你是土壤,就要照顾好鲜花。这就是哲学和这个全新的研究院、哲学和我们的信息网络之间的关系。

      什么是大数据?大数据是由三个“V”组成的——速度(Velocity)、种类(Variety)和数量(Volume)。现实中大数据一直在变化——速度变得更快,数量变得更多,种类也变得更多样,每一天、每一周都是如此。但是大数据有没有限制因素?这三个“V”是否会不断地增长?数据会有它的限制吗?

      从人类诞生以来到2008年,我们一共积累了0.8ZB(约8亿TB)的数据,到2020年这个数字会变成35ZB,这是惊人的爆发性的增长。大数据的增长没有限制因素,因为我们所使用的载体、智能以及我们的存储是没有极限的,它们是动态发展的。

      我刚才所讲的是大数据的一些历史。突然有一天我们发现大数据变成了一种资产。什么时候变成了一种大资产呢?如果要选择具体的一天,大概是在2012年,世界经济论坛宣布大数据成为一种新的经济资产,就像货币或者黄金一样。毫无疑问,它成了下一个经济增长点。我们从世界经济论坛上也听到了很多知名经济学家对于大数据的看法,大家认为它是创新的重要影响因素。

现在是什么组成了大数据?不仅仅是速度、种类和数量,还应该有价值(Value)——从三个“V”变成四个“V”。这四个“V”已经陪伴了我们很长时间,这就是为什么我们今天要来参加这个论坛,讨论大数据。

      但是哲学家总是要不断提问,到底什么是价值?这个价值指什么?讲到大数据的时候,它所体现的价值又是何种内容呢?

      我们首先要问为什么大数据本身有价值?确实大数据能以各种方式被大家所使用,但为什么大数据跟之前的数据相比会更具有价值呢?因为它是元资源,这种资源可以跟其他的资源合并。它有价值是因为它是可持续的,并且可根据不同的目的来使用,跟过去我们所接触到的黄金、石油等其他资源相比,它是无边无际的海洋,而且数据在不断增长,它帮助我们改进现有生活、工作和产品,并预测从医疗到商业多领域的未来趋势。我们也可以用数据来做一些模拟,比如在生物化学实验室里,可能没有人见过某种动物,但是我们可以在计算机上模拟这种生物。

      数据越多,决策过程也就越简单,最终还可以使用大数据来创新。这也是为什么我们认为这种新型资源的价值是不可低估的。《彭博商业周刊》的报道中提到,北京大学光华管理学院的副教授苏萌认为,中国很快会成为世界级的数据市场,数据科学家将会在未来十年里变得炙手可热。据IDC的预测指出,除日本之外的亚太地区数据产业规模将很快从2011年的2.58亿美元增长至2016年的17.6亿美元,复合增长率达到每年46.8%。

      为什么大数据如此重要呢?对于我这样的哲学家来说,大数据的价值是什么?所谓大数据的价值,体现在小模式中。我们需要看到将一个个小数据连接在一起的小线条,这些线条只有当收集到足够数据时才会显现。除非这些小模式连接起来,否则就难以为人们所察觉。因此有足够的计算能力和数据,你才能发现这些数据连在一起是一台电话;如果不太了解技术,你可能就看不到这个“电话”。

      可见,大数据是与研究中这些最为敏感的线条连接在一起的,你会马上发现这种“小模式”决定了一半的数据都是垃圾,但是你不知道是哪一半,只有不断地收集这些数据才能做出判断。

      就像人类过去所有的重大发明一样,除了巨大的价值之外,大数据也包含着相应的风险。那么我们面临的风险是什么?关于未来,我们应该注意哪些方面?

      首先就是大数据和小模式会影响到我们的隐私。当然,还会有新的问题,那就是预测。我们发现有足够的数据,再加上智能化小模式的匹配,计算机就能够提前知道你会规划什么样的行程,喜欢什么样的牙膏。这似乎会影响到我们的自由,我们一直从不可预知性上来理解自由。但这是一种误解,实际上自由与不可预知性无关,自由在于你能解释你选择背后的原因。计算机确实可以预测我们今天要做什么,但是它并不会指导我们这样做的原因。最后,还有来自广告以及那些日益具有说服力工具的压力,它们都在说服你什么是最好的。这些都是大数据带来的风险,但并不是不能克服和避免的。

      当然,不仅仅有风险,还有很多益处。当我们谈到大数据时,我们要记住大数据是有价值的,它有知识和技术的价值,让我们可以更好地去了解这个世界,从卫生、技术、教育到医疗等方面的研究。当然也可以去思考大数据给我们带来的经济和商业价值。例如,企业、企业家利用数据可以创造经济价值,确保未来的一代人会比现在生活得更加美好。因此,大数据并不是经济领域需要解决的一个问题,而是一个巨大的利益来源。

      我们还要关注大数据的社会价值,也就是怎样利用大数据改善生活,提供更完善的商业环境,改善交通运输,再到预测和改善将来的医疗问题。大数据是一个非常好的工具,它可以帮助我们改善生活,给我们带来希望。

      我们应该以什么样的战略来利用大数据的益处而避免风险呢?要制定什么样的价值战略呢?我认为,要设定这样一个战略是比较容易的,但是实施起来很难。大数据可以确保我们避免损害,也可以预防损害或者去除损害,并创建福祉。

      大家可以思考一下医生为患者做什么?医生要尽量防止他的患者出现伤痛,希望他变得更加健康和强壮。大数据对整个社会来说也可以帮助我们这样做——防止和去除伤痛,而且最重要的是可以去改善成百上千万人的生活。

      历史的车轮一直在前进,我们无法阻止它。无论大小、无论机构还是个人,为了确保未来社会的顺利发展,我们都发挥着自己的作用和价值。而同时,数据的价值、量和速度都会增大、增强,就有可能会出现信息过载的问题,出现太多的噪音。面对这样的情形,我们可以做什么呢?

这时,我们就要确保这样一个噪音缺口是尽可能小的,才能充分利用大数据的价值,同时又不会给整个社会体系造成过载,这就是我们研究院的一个非常重要的责任。

      当然我也要强调一下我们本身的哲学理念。这是我们所拥有的,想象一样大数据意味着上万亿个“是”或“否”。我们想要的是信息,而不仅仅是这些“是”或“否”。我们所拥有的是这些答案、这些“是”或“否”,而且还在不断增加。如果要从这些答案中挖掘信息,我们需要界定正确的问题。通过问正确的问题,我们才能从大数据中挤出水分,并给出不一样的社会性语言。

这无论如何都不是一个哲学任务。柏拉图说:“智者应该知道怎么问正确的问题,并回答这些问题。”如果他看到现在互联网研究院的成果一定会非常高兴,因为他会看到我们是在智慧运用先进的技术来处理新问题。