大数据主要有三个来源。首先是互联网特别是社交网络产生的海量信息;其次是大的科学工程早就产生了大数据,比如说“上帝离子”研究中产生的大量科学数据;再者是新的技术催生了很多大数据。我们国家从政府层面号召广大科研工作者对大数据进行研究,很多企业也非常积极。大数据的真正消费者是网民,技术基础是互联网。

大数据实际上给技术人员带来了很多挑战。我们应该在整个生命周期中研究大数据,包括采集、传输、处理、应用。大数据有很多安全问题,我们提倡用大数据说话,不要执迷于大数据。我们既要分析大数据,但不能过分解读。科学研究具有两面性,不要牵强附会找各种关系,既要重视关系但不要过分去解读这个关系。有人希望在大数据之间搞某种联系,通过量化方式对其解释,这种量化经常有很多不全面的因素。总的看来,用好大数据,能维护国家安全,促进政府信息开放,提高决策准确性,推动人类经济社会发展。

见中国信息产业网:中国科学院院士、中国科技大学教授陈国良大数据既要分析但不能过分解读