大数据无疑是未来影响各行各业发展的最受瞩目的技术之一,不仅备受科技界推崇,也成了资本市场的宠儿,不少上市公司就因“沾”上大数据而股价飞涨。那么,大数据这个富矿要怎么挖才可以真正掘到真金白银?在日前举行的腾讯we大会上,IBM全球副总裁王阳指出,目前正处在数据大爆炸的前夜,计算变革开始进入第三阶段,人们正在努力教会计算机如何通过数据实现它的自我学习,即传统意义上的人工智能。
每年一次的we大会由腾讯公司举办,今年是第二届,目的在于探索、分享互联网和科技界的创新成果,打造连接中国与世界的跨界创新平台。2014we大会重点关注太空旅行、脑机接口、人工智能、基因科技、智能交互等领域,这其中,王阳在大会上分享的大数据前景及人工智能计算机watson成为热点话题。
IBM的一项研究显示,过去两年生成的信息占整个人类历史信息总量的百分之九十。换言之,大数据的体量已经达到了传统数据库管理系统无法有效处理的程度。人们无论是使用手机,还是进行网络购物,都会留下自己的数字足迹,每天产生的新数据接近250亿亿字节。其中约80%都是非结构化数据:这些是由原始文本、电子邮件、微博、讨论帖和视频等构成,这些数据来自自然语言,与数据库所能理解的整齐的结构化数据大相径庭。
有鉴于此,王阳指出,截至目前发生了三次计算变革,第一次是制表,把数字输进去,把表格打出来,进行归类。第二阶段是编程,把人们对数字的理解,按照执行的方式方法,教给计算机,计算机不厌其烦地重复处理数据。现在,正处在第三阶段的前期,背景是数据大爆炸,数据不光是结构、非结构的,它还是模糊的,存在不同的可能性,跟以往的计算方式不一样。“这一阶段对计算的要求是,能够教会计算机我们是怎么理解世界的,人类是怎么进行学习、怎么感知和认知这个世界,一旦把这个事情教给计算机,所有数据的产生就让计算机自己去学习。”
目前,一些前沿科技公司在大数据运用上已经取得了一些突破,最新投入运行的人工智能waston即是明证。和google、微软的人工智能相比,waston从硬件芯片构架就开始模拟人类神经元,它可以理解人类的自然语言,还可以通过资料产生假设,并具备不断自我学习的能力。王阳称,watson已经可以通过开发者向智能终端用户提供服务,开始为一些科学家服务,主要运用于医药领域。他说,伴随着watson的改变是,把这个平台开放出来,在云上面部署,任何对这些方面很好研究的人,都可以利用这个平台进行加工,再重新进行反馈。
对于大数据来说,未来可能将不同的行业更加细分,针对不同的行业有着不同的分析技术。王阳认为,数据的多少并不意味着价值更高,但是更多的数据无疑更有助于一个行业的分析价值的发现,如医疗行业,如果每一个医院对自己的数据进行分析,也能获得相应的价值,但是如果想获得更多更大的价值,则需要全国乃至全世界的医疗信息共享,这样才能够通过平台分析获取更大的价值。王阳表示,中国在未来将可能成为大数据最重要的市场,因为人口众多且经济发展迅猛,中国的数据产生量将是巨大的,这给中国大数据产业发展带来机会。
见光明科技:大数据正处于爆发前夜