腾讯研究院研究员 卢依
对于数据开放政策,欧盟将其定义为“对公共数据的再利用”,即将本由政府和公共机构所产生,收集或者付费获得的数据开放给公众再次使用。实行数据开放不仅能够增强执政透明化和可靠性,更重要的是数据中所包含的潜在效益将被开发和再利用,创造更多的经济价值,提高社会运行的效率,为消费者提供更加优质的产品和服务。欧盟数据开放政策与美国相比虽然略显保守,但体现出自己独有的特点,即数据开放紧密围绕公共服务需求,科研及民生类数据优先程度明显较高。
稳步推进 分类开放
欧盟委员会通过“开放数据战略”以及《公共数据数字公开化决议》(《决议》),确立了跟美国相比而言较为保守,逐步开放的政府数据开放模式。《决议》的具体政策措施包括:(1) 建议重新修订欧盟于2003年制定的公共部门信息再利用指令。(2) 基本通用规则是所有公共财政资助所获取的资料数据,以符合商业化或非商业化服务的方式向社会公开,除非涉及第三者的知识产权保护。(3) 原则上公共部门不得向数据再利用者收取使用费或由此产生的成本费(边际成本)。实际操作中,此意味着提供的绝大部分数据是免费或几乎免费的,除非过高的成本得到确认。(4) 强制所公开的数据必须是社会流行的格式和计算机可读的形式,从而保证数据的有效再利用。(5) 扩大公共数据公开的部门范围,公共图书馆、博物馆及档案馆将首次纳入数据需要公开的公共部门目录。(6) 欧委会2011-2013计划对数据公开的信息技术应用及研发投入1亿欧元,各成员国及公共部门均应列入必要的研发预算。建议设立专门的机构对上述政策措施的执行落实进行督促和监督。
2012年,欧盟委员会推出公开数据门户网站测试版,为外界提供了大量来自欧盟委员会、欧盟组织和机构的数据信息,任何人均可以自由下载相关数据。这一门户网站目前拥有5811个数据集,其中大部分数据来自于欧盟的数据部门Eurostat。欧盟在2014年7月公开发布建设政府数据开放平台的招标书,目标是建立泛欧盟地区统一的正式数据门户网站,而该网站建成后将超过美国的data.gov和英国的data.uk成为目前世界上最大的政府数据网站。在这些已经出现的政府数据门户网站上,重点开放的是可机读的数据集(datasets)、应用程序 (APPS)等资源,有些数据门户网站上还设置了供开发人员参与和公众反馈的专栏。英国除了全国统一的数据门户网站外,伦敦、曼彻斯特等地以及索尔福德市议会等16个地方和部门还建立了独立的开放数据门户。在英国的数据开放门户网站(data.gov.uk)上,共开放了13670个公开的数据集以及4170个非公开的数据集。
就数据开放种类而言,欧盟目前已经大量开放了科研,环境和医疗数据。在开放科研数据方面,欧委会推出的主要措施包括:(1) 原则上一律公开欧盟第七研发框架计划(FP7)和未来2020地平线(Horizon 2020, 2014-2020年期财政年度)科研与创新框架计划的所有科研基本数据;(2) 由欧委会公共财政完全出资的科研论文与科技成果,研究人员有义务自觉、随时和立即公开科研基本数据(欧委会网站“金色”通道);(3) 研究人员必须以可利用的方式公开科研论文,自然科学以6个月为期限或人文科学以12个月为期限,录入欧盟知识数据库(欧委会网站“绿色”通道)。
欧委会建议,成员国应对本国的公共科研计划积极采取类似的行动举措,目标是到2016年,实现欧盟范围内至少60%以上的公共研发与创新数据公开。欧委会将尽快制定出科研数据公开的具体操作规范,包括投资者或私人的科研成果转化或商业化的法规准则。欧委会将采取的具体行动包括:(1) 建立2020地平线研发与创新框架计划的科研成果同行评审制度;(2) 理顺公共科研成果与私人商业化或技术转移之间的法律利益关系;(3) 创建科研信息共享电子基础设施(e-infrastructure)平台,实现欧盟成员国之间、以及全球之间的互联;(4) 促进科技界树立科研公开意识、形成数据共享机制和创造人类共同财富。
民生类应用优先程度高 科研环境数据应用广泛
数据开放的核心目的是更好地满足公众的需求,通过直接提供大量优质数据,促进新产品和服务的发展,为社会提供更好的公共服务。与这一需求相对应,从欧盟开放数据情况来看,围绕民生需求的数据在开放数据中比重最高,也颇受用户欢迎。欧盟主要国家英国、法国、德国、意大利参与签署的《数据开放宪章》中提到的十四类高价值优先开放数据中,与民生相关的多达九类(社会福利,交通,医疗,教育等)。
目前已有许多企业开发出基于政府数据的民生类应用,市场反响也相当不俗。欧盟有较多的数据开放应用是基于环保类数据的公开,例如欧盟森林火灾信息系统免费提供在欧洲范围内的野外森林火灾信息。用户可以通过应用获取关于火灾的最新可视化信息,包括气象火灾风险地图及6天之内的预报、每日卫星图像信息,最新热点地图以及火灾范围等。此外,欧洲海图通过利用来自欧洲数据统计局的公开数据,向社会公开有关海洋气候和相关环境政策的可视化实时信息,不仅服务于普通民众,对于相关领域内的学术研究也起到促进作用。
目前欧盟也已经公开由“哥白尼”地球观测系统搜集的所有环境数据,以更好地进行环境监测,并为欧洲企业创造新的商机。消息称,研究显示,到2030年哥白尼系统将带来300亿欧元的经济效益,并创造五万个就业岗位。此外,开放数据机制将帮助公民、企业、研究人员和政策制定者在决策和行动时更好地考虑环境因素。在医疗数据方面,随着制药公司签署信息公开计划,欧盟境内要求完全公开临床试验数据的呼声也日益高涨起来。欧盟正计划对那些促进市场应用的全欧所有临床试验数据实施强制性披露。欧洲制药工业协会联盟(EFPIA)和美国药品研究与制造商协会 (PhRMA) 对此作出了反应,两个单位在一月份实施了一项自愿行动计划,审查外部研究人员的提议,那些研究人员想获取美国和欧盟获批新药的临床试验数据、临床协议和临床研究报告。不久之后,强生公司宣布跟耶鲁大学公开数据访问项目 (YODA) 合作。葛兰素史克公司、罗氏公司和其他一些制药公司也成立了独立委员会,审核获取机密研究信息的请求。参与进来的公司希望这些努力能够巩固它们尽职尽责的创新研究实体的形象,同时对于哪些人可以获取病人层面的数据保留了一定的控制权,对于商业秘密信息也进行了一定的保护。
与美国一开始就立法推行数据开放政策不同,欧盟的数据开放更多地始于修法和去除既有的法律障碍,鼓励科研创新,同时促进欧盟各国的协调交流以构建信息社会的战略框架,形成大环境与数据开放相辅相成,互相促进的生态系统。开放数据已经成为信息社会的基石和创新的趋势;欧盟及时响应,在政府战略上自上而下进行调整和规划的做法也为我国未来的数据开放实践提供了有价值的参考。