数据开放┃浅析美国数据开放战略及其发展历程

|研究员专栏 作者:lilian 2015-05-11

腾讯研究院研究员 卢依

  传统意义上,人们对公共信息公开的理解主要是提高政府透明度,但实际上开放公共数据的意义远大于此。政府所掌握数据具有规模大,持续性强,可靠程度高的特点,这些数据的流通与再利用能够给社会带来意想不到的经济和科研价值,同时对于教育,医疗等社会治理和公共服务领域也有巨大的促进作用。纵观全球范围内的数据开放政策,虽然历史不长,但发展十分迅猛。美国作为最早实施数据开放政策,并逐渐将其发展为治国战略的国家,许多经验都具有参考意义。

  (一)政策完善,助力经济发展
  美国是第一个推广数据开放的国家。数据开放的说法虽然直到1995年才出现,但将政府数据开放给公众使用的概念在1968年加州的公共记录法案(Public Records Act)中已经成型。该法案要求加州内各个市政当局将政府向公众披露各类政府记录。21世纪以来,随着开源运动的兴起,数据开放的重点逐渐向建立提供大量软件代码的公共数据平台发展。
  2013年,美国通过《政府信息公开和机器可读行政命令》(下称“《行政命令》”),正式确立了政府数据开放的基本框架。《行政命令》中指出,确保以多种方式将数据公开发布,让数据易于被发现、获取和利用,政府部门应当保护个人隐私、保密和确保国家安全。在此基础上,原先不易获得的数据应当能够为企业家、研究人员以及其他任何致力于开发新产品和新服务的人所使用。数据的扩大利用同时也能够创造更多的就业机会,尤其是对致力于成立初创企业的中产阶级而言,这一部分人群构成了美国经济的关键部分,政府希望借数据开放助力他们的发展。白宫表示将持续致力于实现数据的开放工作,并且力求提供一站式资源,汇总所有目前已经开放的数据和开源软件,让开发者和普罗大众能够更好地利用数据开放实现更高价值。
  《行政命令》就政府数据开放确定了以下几个要点:
  1.  总体原则

  •   确保数据资源“易于寻找,便于利用,形式上具备可用性”,能够真正服务于推动企业发展,创新活动和科学研究;实现优化国民生活并促进就业机会增长的目的。
  •   在开放数据政策下,如无其他规定,默认政府信息和数据资源应当处于开放和可机读的状态。政府应当将信息作为资产的一部分由始至终进行管理,推动其互通性和开放性,在法律允许的情况下确保将数据对公众发布并且遵循“易于寻找,便于利用,形式具备可用性”的原则。在这一过程中行政机构和政府机关应当保障个人隐私,保密性和国家安全相关问题。

  2. 数据开放政策

  •   要求管理预算局在咨询首席信息官、首席技术官,以及信息监管事务局后制定并发布《数据开放政策》,协助政府部署数据开放工作。
  •   各行政机构需落实数据开放政策中的要求,并且在涉及数据开放的整个过程中结合有关隐私,保密性,和安全风险方面的考虑,避免不应公开的数据泄露,这些环节应当由隐私方面的高级管理人员把关。政府机构开放数据不可违反法律政策,或者妨害隐私保护,保密性和国家安全。

  3. 数据开放政策的具体实施. 为确保各个政府部门能够广泛落实数据开放政策中的具体要求,行政命令规定:

  •   数据开放政策颁布30天内,首席信息官和首席技术官应当发布数据使用工具和最佳范例的在线数据库,协助各个政府机构将数据开放政策提倡的流程结合到本部门的日常运营中。首席信息官和首席技术官应定期更新在线数据库,确保它作为重要资源协助数据开放实践。
  •   数据开放政策颁布90天内,预算管理局首席绩效官应当与总统的管理委员会联合成立跨部门优先目标计划(Cross-Agency Priority ,CAP)以便核查各部门落实数据开放政策的情况。首席绩效管应当与各个政府机构沟通,制定数据开放的绩效目标,确保各个机构有明确的实施方法和衡量标准。具体目标和进展将由机构负责人根据有关法律进行审核。
  •   行政命令发布180天内,各政府机构应当就CAP目标的实现情况对首席绩效管进行汇报,此后每季度进行定期汇报。

  2014年5月,白宫第二次发布了有关数据开放政策的进展和下一步计划。在这次总结当中,政府表示之前的数据开放工作已经在健康,能源,气候,教育,财政,公共安全和全球发展这几个主要领域展开。数据开放项目也起到了良好成效。同时美国也与其他国家的数据开放工作进行交流。2013年6月,奥巴马与其他G7国家领导人共同对数据开放章程进行背书,美国承诺公布自己政府数据开放的方案和具体做法,以便其他国家进行参考。在上述基础上,白宫发布《美国数据开放行动计划》。
  《美国数据开放行动计划》的具体举措包括:

  •    小型商业数据: 将进一步发展和加强小型商业管理局(The Small Business Administration’s ,SBA) 相关的数据库,便于软件开发者开发相关应用,帮助生产商更容易找到合格的美国供应商,在美国境内降低寻找供货来源的交易成本
  •   史密森尼美国艺术博物馆: 该博物馆的所有数据收藏将会开放给软件开发者用于开发与教育有关的程序和工具。目前即使是博物馆馆长也未必能够轻易获取有关馆藏的数据和信息,类似这种类型的数据开放将能把许多宝贵的艺术教育信息提供给普罗大众使用。
  •    食品药物监管局(FDA)药物不良反应数据: 每年医疗从业人员和消费者提交给食品药物监管局有关药物安全的独立报告都多达数百万。这些匿名报告所包含的信息实际上对于药物安全监测是非常关键的工具。目前这些信息只在季度报告中限量公开。但很快FDA将这些报告完全公开,以便软件开发者可以设计工具,促使危险药物尽快下架。

  (二)数据开放实践多样化
  1.专门的政府数据网站data.gov:2009年,在时任联邦首席信息官Vivek Kundra带领下设立的美国政府网站。目的是提供由联邦政府行政分支产生的数据,并且协助公众以可机读的形式获取这些高价值的数据。这个网站的职能是成为政府所收集数据的档案馆,只要不是私人所有或者受限于国家安全原因,所有政府收集的数据都应在这个网站上进行公开。2013年起这个网站在开放政府数据的基础上进一步加强了网站可视化,导航,以及帮助公众更好地定位和理解相关数据的工具。网站同时为开发者提供了各种API接口。
  2.新的开源工具:成立开放数据项目(Project Open Data),美国首席信息官和首席技术官均在Gitub(给开发者合作交流的开源社区)发布免费的开源工具. 这个项目通过提供可以直接使用的工具和最佳范例,帮助数据中介更好地管理和公布数据。举例来说,有些工具能够直接将表格和数据转化成开发者可以直接接入使用的API。无论是政府机构,普通市民或企业均可以直接免费使用这些工具。
  3.进一步打造21世纪数字政府行动:作为奥巴马数字政府战略和数据开放工作的一部分,持续与各级政府机构合作,在保护隐私和国家安全的基础上开放更多数据
  4.持续与企业家和创新者合作,为他们使用政府数据提供帮助: 奥巴马政府将持续组织各类峰会,聚集公司,组织和社会成员,让公众更加了解创新活动如何使用开放数据形成对公众的影响力并面对不同的挑战。
  美国纽约市通过的《开放数据法案》是美国历史上首次将政府数据大规模开放直接纳入立法。根据《开放数据法案》,到2018年纽约市政府及其分支机构所拥有的数据都必须实现对公众开放,并且规定使用这些数据不需要经过任何注册、审批程序,数据的使用也不受限制。旧金山也开始了类似的开放数据工作,在硅谷浓郁创新氛围的支持下,在很短的时间里就诞生了大量基于政府开放数据的新应用。
  事实证明美国政府的开放数据确实为美国经济的发展起到了巨大的促进作用,最典型的例子就是气象数据的公开。美国政府公开来自政府卫星和地面气象站的数据直接推动了美国气象信息产业的形成与发展,包括气象预报,商用农业咨询服务,以及新的保险服务等。同样的例子包括美国政府公开全球定位信息GPS。之前这一领域的数据只保留给军事用途,现在已经开放给民用和商业领域,推动了一系列以GPS信息为基础发展起来的产业,包括航空器导航,精确播种和各类LBS服务等,给美国每年总的经济规模贡献多达数十亿价值。目前政府还在上述基础上推行医疗数据开放,即将政府掌握的有关医院,药品,健康保险等有关的数据以及其可读的形式进行公开。数百项与健康服务方案转型和患者信息有关的服务和公司已经得益于这一数据开放政策。
  自从美国政府在2009年发布Data.gov 站点以来,越来越多的数据被搬到了线上并开放给第三方使用。随着近年来极端气候事件频频发生,白宫在3月19日宣布来自美国国家海洋大气局、美国国家航空航天局、美国地质调查局以及其他联邦机构的气象数据也将被放在开源站点Data.gov 上。美国政府希望通过这项数据开放计划能吸引更多的社会机构和研究团体参与到气候研究中来进而降低极端天气事件带来的损失。仅在2012年,极端天气事件给美国带来的损失就高达1100亿美元并造成了超过300人死亡。所以白宫想通过这项数据开放计划让研究机构和社区能更好的了解气候变化带来的影响并预防可能到来的灾害。除了基本的气象数据之外,Data.gov站点还提供了若干工具和资源来帮助参与者更好地发掘数据背后的价值。目前,第一批与沿海洪灾和海平面上升相关的气象数据已经可供公众查阅。美国海洋大气局和美国航空航天局也在借此号召研究机构和开发者创作一些数据驱动型的模型以评估未来可能会面对的困境。此外,相关机构也能够告诉公众他们的社区在海平面上升和洪灾面前是多么的脆弱。
  除了政府层面的合作,若干知名企业也参与到这项数据开放计划之中。美国环境系统研究所将和12座城市合作建立免费的地图和应用来帮助政府为气候变化带来的影响做准备。Google除了捐献1000万亿字节的云存储空间来存储各种卫星观测和气候模型数据外,还在Google Earth Engine地理空间分析平台上提供了5000万小时的高性能计算能力。通过Google Earth Engine,研究者可以查阅40多年的卫星地图数据。Google希望通过这些资源,研究人员能真正解决一些气候为人类生存带来的灾害问题。

  从美国的数据开放实践可以看出,数据开放早已从最早的州法层面上升到成为联邦政府治国战略的一部分。开放数据以开发者的劳动为媒介,以创新产品和服务的形式造福普通民众,对政府服务起到补充作用,同时也进一步促进民生福利和产业经济的发展。政府在这一过程中扮演着多重角色,即是原始数据的提供者,也是数据开放模式的设计者,以及使用数据的利益相关方的监管者。政府既要考虑开放数据生态环境的发展与持续活跃,同时传统的政府职能也要求政府在开放数据的过程中控制风险。美国政府对于数据开放的具体实践鼓励多样化,给予很高的自由度,但前提是通过最高立法的形式对于数据开放做出原则性规定,以清晰的执行程序确保数据开放与隐私、保密和国家安全利益相冲突。美国政府所建立的综合性数据开放机制是很值得其他国家参考借鉴的。


前沿杂志
互联网前沿61

2022年,从引爆AI作画领域的DALL-E 2、Stable Diffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。

2023-05-12

全站精选