公共数据、基础设施与人工智能:数据市场发展的三个驱动力

王星    腾讯研究院资深专家

根据《数据要素赋能新质生产力》研究报告、中国国际经济交流中心“数据要素推动数字经济高质量发展”专家座谈会发言内容等整理。

二十届三中全会从数据基础设施建设、数据生产关系调整、数据宏观治理优化等维度介绍了数据要素市场的发展导向和政策布局。回顾和总结国内外的发展经验,对于我们准确认识数据要素的发展规律,特别是探索数据要素如何进入社会化大生产、如何安全可控的释放乘数效应价值具有重要借鉴。

“数据二十条”发布近两年来,在政策支持和市场主体的积极参与下,国内数据要素市场呈现出多层次发展和技术驱动的显著特征。对比国外数据市场发展规律,可以看到,以公共数据开放共享为牵引、数据基础设施建设为支撑、人工智能为驱动越来越成为数据要素市场发展的产业共识和重要模式。

国外四种典型的数据市场发展模式

1.美国模式:
推动政府数据开发利用,鼓励市场主体开展数据应用创新

美国在数据市场构建方面一直处于全球领先位置,率先提出“政府数据开放战略”,以数据驱动政府决策治理能力提升为牵引,大力推动各政府部门探索符合自身特色的数据开发利用场景,改善政府管理数据方式、提高服务社会效能。当前,美国建立了“政府引导、企业参与、市场运作”的数据应用市场,数据要素应用场景发展十分丰富,涵盖消费、农业、医疗、教育、政府管理等多个领域。例如,政府治理领域,美国总务管理局在政府所属基础设施中安装物联网传感器,由美国国家航空航天局利用人工智能技术分析卫星收集的数据,实现智慧建筑管理。Follow My Vote公司开发基于区块链的在线投票平台,采用加密技术保证选举结果的准确性和可靠性。农业领域,纽瓦克垂直农场通过对作物生长环境和长势进行监测,利用大数据技术实现智能决策,相比传统农场节水95%、减肥50%,实现农药零投入。金融领域,华尔街“德温特资本市场”公司通过分析3.4亿账户留言,判断民众情绪,并依据人们高兴时买股票、焦虑时抛售股票的规律,决定公司买卖股票的时机,从而获取盈利。能源领域,提出绿色按钮倡议,使客户能够轻松安全访问用水、电力和天然气等能源使用数据,提高能源消耗意识,并帮助消费者节省能源消耗。

在数据的共享、交换、交易等各种应用活动中,数据经纪商在其中发挥了一定作用。其并不直接从用户方收集个人数据,而是通过政府、商业以及其他公开数据来源获取,并将原始信息和衍生信息进行整理、分析和共享后,将这些信息出售、许可、交易或提供给与消费者无直接关系的企业,用于产品营销、个人身份验证或欺诈行为检测等。目前美国约有3500-4000家数据经纪公司,主要提供市场营销、风险控制以及人员搜索等服务。例如,专业的地理信息数据经纪商Factual,其平台上已累积横跨200多个国家的超过1亿个地理位置信息,数据更新频次达每月240万次,数据访问频次达每月90亿次。

2.欧盟模式:
深化数据空间战略,加快布局一体化数据开发利用基础设施

欧盟历来重视数据保护,尤其对个人数据的保护。通过制定严格的法律法规,欧盟在全球数据治理中的话语权显著提升,且逐渐形成了“严格个人信息保护、建立共同数据空间”等数据要素市场化方式和路径。建立“共同数据空间”,创新数据跨领域共享交换工具。欧盟通过《欧洲数据战略》确立了欧盟范围内数据安全开放共享战略,打造了数据要素共享交换的“共同数据空间”平台,涵盖金融、农业、交通、能源、健康等十个领域,推动欧盟内部数据流通和开发利用。加强个人信息保护,形成完整的数据权益法律法规体系。此外,还相继颁布《通用数据保护条例》《数据法案》《数字服务法案》《非个人数据自由流动条例》《数据治理法案》《关于公平获取和使用数据的统一规则提案》《数字市场法案》等数据保护法规,尝试设定严苛的数据要素场景准入门槛。不断扩大公共数据供应规模,提高公共数据共享程度。为推动公共数据开放利用,欧盟早在2003年就颁布《公共部门信息再利用指令》,随后经两次修订,公共数据开放范围进一步扩大,涵盖金融、气象、法律等多个领域。提出数据利他倡议,鼓励居民自愿贡献数据。为促进数据交易共享,创设数据中介制度,由数据中介服务提供者促成交易双方的数据共享,提升交易主体互信程度。

此外,加大资金布局数字基础设施,为数据要素创新应用发展提供技术支撑。投资共同欧洲数据空间和互联云基础设施,围绕公共数据集、数据中心、开放平台、算力中心等基础设施构建强大的数据生态系统。据统计,欧洲在29个国家/地区拥有约217个经过认证的数据中心。

最后,提高国际交流门槛,提升数据全球流通话语权和影响力。通过构建高门槛高标准的数据跨境传输规则,持续向其他非欧盟国家输出欧盟模式,深刻影响国际数据流动规则的形成。一是已吸引世界主要经济体加入欧盟的《通用数据保护条例》充分性认定。二是迫使美国等全球主要数字经济体在个人数据保护方面作出妥协。三是已成为全球数据区域合作的参考范本。

3.日本模式:
倡导可信数据自由流动,高度重视公共数据集建设

在数据市场建设中,日本倡导“政府指导、民间主导”的发展模式,加快社会数字化转型,推进数据跨境流通。倡导可信数据自由流动,推进数据跨境流通,推动日本成为全球重要数据流通中心。日本在国际上倡导可信数据自由流动,即在严格保护个人信息、网络安全和知识产权的基础上,推动工业、健康等领域非个人、匿名、有用信息的自由流动。2019 年 2 月,日本与欧盟达成《欧盟日本数据共享协议》,这一对等充分性协议创造了全球最大的数据自由流通区域,极大地促进了日本大数据和人工智能产业的快速发展,吸引大量海外IT巨头与日本开展数据交换。日本数据中心市场规模快速增长,以东京都市圈为例,数据中心建设集聚,已成为Meta和谷歌等美国IT巨头实现数据流动的中转站。太平洋海底光缆铺设投资旺盛,预计经由日本的数据通信将更趋活跃。

日本广泛推动政府数据开放,促进公共数据的社会应用,助力企业创新发展。日本政府计划使作为最大数据持有者的行政机构本身成为全国最大的平台,让公共数据充分流动。在国民经济、司法安全、人口环境等17个领域开放了公共数据集。除此之外,还设立了多级政府数据公开网站,并针对专业领域设立特色数据开放网站。庞大的开放数据集在应急管理、环境卫生、农业生产管理等领域均实现了有效利用。如会津若松市基于政府公开的消防水利位置信息推出消防栓地图web应用,有效帮助消防员及普通市民在遭遇火情时可以迅速反应。water-cell公司设计的agri-note应用可以整合农林水产省、农林水产消费安全中心发布的农药和肥料数据,助力农业经营者提高农业生产管理效率。

此外,日本以“数据银行”为核心建立数据要素交易市场体系,释放个人数据价值。数据银行在与个人签订契约之后,通过个人数据商店对个人数据进行管理,获得个人明确授权后,将数据作为资产提供给数据交易市场进行开发和利用。交易数据大致分为金融数据、医疗健康数据及偏好数据三类,其业务包括数据保管、贩卖、流通在内的基本业务以及个人信用评分业务等。数据银行搭建起个人数据交易和流通的桥梁,促进了数据交易流通市场的发展。

4.韩国模式:
发挥人工智能等新兴技术作用,促进数据要素开发利用

韩国鼓励结合人工智能等新兴技术,促进数据要素在社会各领域应用发展。以健全完善的基础数据底座和数字基础设施共同促进数据要素开发利用。通过建设“数据大坝”、实施“韩国网络基础资源共享计划(K-Cloud计划)”等措施不断促进公共数据开放利用以激活数据要素市场,激发中小企业的创新活力。大力投入以“DNA”,即D-大数据(Data),N-5G网络(Network),A-人工智能(AI),为代表的数字基础设施建设,保障数据要素安全、高效流通。

在医疗保健领域,利用医疗大数据和人工智能技术提供基于数据分析的医疗保健服务,结合元宇宙进行虚拟医疗实践等。在环境、社会和公司治理(Environmental, Social and Governance,ESG)领域,通过ESG门户网站,可查看ESG披露数据和投资统计数据。在工业制造领域,基于物联网、云平台、人工智能、数字孪生等技术实现工厂数据的采集、存储、管理、分析和可视化展现,进而实现智能工厂建设,同时实现供应链的数字化和智能化。在农业领域,努力开发将大数据和人工智能融入农业领域的系统和平台,加快以私营部门为主导的服务发展和农业商业发展模式。

此外,韩国重视以个人数据管理(Mydata)为基础的数据交易模式。Mydata服务最初主要应用于金融领域,用户可基于Mydata实现个人财富管理和商品推荐。MyData应用场景丰富,涵盖存款、贷款、信用卡、通讯和保险以及支付等金融场景,也包括公共行政、医疗等领域。通过Mydata服务,个人可一次性地查询分散在不同机构的个人数据,并主动、有选择性地向某些企业提供个人数据来获得商品或服务的推荐。

我国已形成多层次数据要素市场共同发展、彼此促进的新格局

1.顶层设计:
数据基础制度和管理体制建设加快

为充分发挥我国海量数据规模和丰富应用场景优势、释放数据要素价值,近年来,我国在政策体系、机构设置等方面加快布局,多地多措并举推进制度探索。

顶层设计层面,围绕数据要素创新应用、数据基础制度等政策体系和管理体制不断完善。政策层面,2019年10月,党的十九届四中全会首次将数据列为第五大生产要素,我国由此开启数据要素市场化配置改革制度探索。在此基础上,2021年以来,陆续发布《“十四五”数字经济发展规划》《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》《数字中国建设整体布局规划》《“十四五”大数据产业发展规划》,完善数据领域战略规划、数据基础制度,旨在充分发挥我国海量数据规模和丰富应用场景优势,激活数据要素潜能。今年年初,《“数据要素×”三年行动计划(2024-2026年)》印发,明确围绕12个重点行业领域充分发挥数据要素乘数效应,大力推动数据在多场景应用,实现对经济发展的倍增效应。据国家数据局介绍,目前关于数据产权、流通交易、收益分配、安全治理、公共数据开放等政策文件也在起草推进之中。

管理体制层面,我国于去年组建国家数据局,完善国家数据管理机制,统筹数据资源整合共享和开发利用,并牵引地方数据管理体制改革深入推进。目前31个省(区、市)和新疆兵团均完成机构组建,其中,独立设置机构26个,加挂牌子6个,实现地方机构设置和职能配置与国家数据局上下联动。

在国家政策指导下,地方数据要素市场建设加快探索。多个省份结合自身优势,将数据要素场景创新发展作为建设数据要素市场的重要抓手。如《北京市关于更好发挥数据要素作用进一步加快发展数字经济的实施意见》推动工业、金融、商贸物流、自动驾驶、医疗、文化等领域数据应用场景示范。广东省《“数字湾区”建设三年行动方案》探索粤港澳大湾区在数据交易、普惠金融、供应链等领域开展业务场景试点,推进智能制造、智慧社区、智慧城市等应用场景建设。上海建设国际数据港,开展全球供应链数据流通与信息共享、文化与数字内容出海、跨境电商直播等场景创新试点。江苏省《关于推进数据基础制度建设更好发挥数据要素作用的实施意见》构建交通水利、城乡建设、自然资源、文化旅游等领域数据开发利用场景。实践中,各地围绕数据流通交易开展更多探索。如北京市将北京国际大数据交易所接入北京市金融公共数据专区和北京市公共政务资源网,对全市公共数据进行托管运营,依托统一平台开展公共数据场内交易。贵州省将算力资源与算法模型、数据产品集成打造多元化数据产品体系。海南省打造数据产品超市,开展数据产品供需对接、产品定价服务、贡献激励和安全监管等管理和服务。

2.技术变革:
人工智能引领产业向数据驱动模式转型

人工智能是发展新质生产力的重要引擎,已成为引领新一轮科技革命和产业变革的重要驱动力。以ChatGPT等为代表的AIGC(生成式人工智能)技术应用火遍全球,大模型技术取得创新突破引发人工智能技术深刻的变革,并加速向多行业渗透。

一是人工智能大模型场景应用和产业发展迅速。2023年以来,多地积极推动相关技术和产业并取得快速进展。如《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》重点支持在智能制造、生物医药、集成电路、智能化教育教学、科技金融、设计创意、自动驾驶、机器人、数字政府等领域构建示范应用场景。《北京市促进通用人工智能创新发展的若干措施》推动通用人工智能技术在政务、医疗、科学研究、金融、自动驾驶、城市治理等创新场景应用。截至2023年底,我国人工智能核心产业规模近5800亿元,已经形成京津冀、长三角、珠三角三大集聚发展区,核心企业数量超过4400家,居全球第二。目前,国内参数规模超10亿的大模型已经超过100个,主要集中在通用领域,涵盖自然语言处理、计算机视觉和语音识别等技术领域。

二是人工智能大模型引发产业效率革命。通过结合多模态数据和智能算法,大模型赋能工业、交通、商贸、医疗、能源、交通、金融等众多行业向数据驱动模式转型,助力行业提质增效。工业领域,大模型可以作为智能质量控制器,根据生产数据和标准,自动检测和纠正产品质量问题。比如,腾讯软硬一体AI外观质检解决方案服务了众多制造企业的外观检测项目,不仅检测能力全面超越人工水平,而且检测效率相较人工质检提升10倍,每年能为客户节省人力成本数千万元。交通领域,大模型实现准确预测交通拥堵,推动智能交通管理。比如,商汤日日新大模型体系已为郑州、哈尔滨等地城轨30条线路、640个车站提供智能化升级。商贸领域,大模型通过分析预测消费行为、市场竞争态势等,实现对客户的精准营销、优化库存管理和供应链。比如,京东言犀人工智能平台推动采购自动化率至85%,库存周转降至31.2天。医疗领域,大模型可用于辅助疾病诊断和预测,并提高医疗信息化效率、改善在线问诊、实时监测预警和提升药物研发效率。比如,云知声山海大模型助力北京友谊医院实现门诊病历生成系统。金融领域,“RPA+AI”(Robotic Process Automation,机器人流程自动化)技术应用不断深入,实现数据的自动抓取、清洗和更新,加快了小微金融信贷服务业务场景的拓展。

3.可信流通:
合规监管和安全可信技术加速落地

随着数据与生产、分配、流通、消费和社会服务管理等各个环节的快速融合,数据安全的重要性日益凸显。近年来,我国强化数据安全技术支撑能力和专业服务体系,助力数据供给、流通、使用全过程安全保障,为数据要素产业化应用提供重要前提。

一是数据交易行为合规监管加速落地。一方面,对数据交易主体准入、数据来源审查、登记备案、数据资产流转、凭证生成等环节加强监管,保障参与各方的合法权益,避免数据泄露和数据滥用事件的发生。目前实践主要有三类方式。第一种是限制交易类别。比如,山东、深圳等地探索建立数据流通交易负面清单制度,明确不能交易或严格限制交易的数据项,规范各类主体在交易过程中的行为,提高行政监管的透明度和效率。第二种是明确数据流通交易制度规则。比如,广东出台数据流通交易管理办法,贵州制定实施数据流通交易促进条例。第三种是数据交易平台探索细则指引。比如,上海数据交易所在《上海数据交易所数据交易管理办法》基础上发布《上海数交所交易规则体系(2024)》,搭建了“办法—规范—指引”三级交易制度结构。另一方面,完善市场服务对数据合规的支撑作用。支持发挥数据服务商和第三方服务机构在审查评估方面的作用,目前我国数商企业已经超过200万家,近十年年均复合增长率30%以上。

二是数据安全流通设施和技术路径不断创新。一方面,各地公共数据平台和数据交易平台探索应用区块链、隐私计算、加密算法等技术,加快突破“数据可用不可见、可控可溯源”的数据流通技术,为多种模式、多种形态的数据要素流通方案提供可信技术底座。另一方面,数联网、数据金库、可信数据空间等数据流通的新型基础设施加快创新。比如,中国电子的数据元件和数据金库产品,以物理隔离、数据托管和模型转换实现存用分离,帮助解决关键数据分散、安全保障不足等难题。可信数据空间领域,我国发布了15家应用解决方案供应商和首个标准,其中智能制造领域数据空间应用案例已落地,并逐步向制造业、物流等泛工业行业扩展。

4.转型牵引:
重点行业领域数字化转型步伐加快

我国数据资源应用场景丰富,智能制造、商贸流通、交通物流、金融服务、医疗健康等重点行业领域加快数字化转型,平台在科技创新、技术赋能、产业变革等方面继续发挥重要作用,不断拓宽数据要素应用场景。

制造业等行业领域数字化转型深入发展。数字化转型推动企业在技术、管理、流程、组织方面构建系统性解决方案,支撑业务数字化、场景化、柔性化运行,拓展数据要素应用广度和深度。目前,我国产业数字化转型更加深入,智能制造和工业互联网加快发展,5G、千兆光纤网已融入71个国民经济的应用中,应用案例已经超过了9.4万个,建设5G工厂300家。制造业重点领域数字化水平加快提升,关键工序数控化率、数字化研发设计工具普及率分别达到了62.2%和79.6%,推动数据要素在决策分析、智能生产和管理、供应链协同、精准营销等场景应用。部分地方加快推动制造业数字化转型,加速数据要素在智能制造场景应用落地,如《北京市制造业数字化转型实施方案(2024—2026年)》提出分行业培育一批智能制造示范工厂与优秀场景。此外,金融、交通、医疗等多领域数字化转型不断深化,如金融领域全面推进银行业和保险业数字化转型,以数据赋能完善金融信用体系,提升风险防控能力,推动金融产品普惠化、向善向绿发展。

平台在产业数字化转型中发挥重要作用。平台成为实现技术赋能产业的重要载体。一方面,平台具有更为精确的信息匹配能力、更为高效的运作效率和更为快速的信息反馈能力,在数字化改造中扮演助推器和加速器。截至2023年底,具备行业、区域影响力的工业互联网平台超过340个,有效连接产业链上下游企业等各类参与者,采集和汇聚海量工业数据,形成以平台为核心的资源共享、生产要素高效配置,促进供需精准匹配、产业链协同互补。另一方面,平台企业通过投资和数字化转型业务,持续加大在数据要素领域投入,赋能传统产业转型升级。比如,国家发展改革委和国家数据局公布的平台企业典型投资案例中,腾讯、美团等平台企业对工业互联网、大数据基础软件与服务、自动驾驶等领域科技创新型企业投资,促进传统产业高端化智能化发展。另外,根据财报信息,2024年第一季度,腾讯金融科技及企业服务板块收入占比达到33%,连续七个季度占比第一,已成为腾讯未来增长的重要引擎。

5.机制突破:
数据价值化制度探索路径逐步清晰

数据价值化是数据进入市场流通的前提,推进数据资产管理合规化、标准化、增值化,强化数据资产高质量供给,有利于激活“沉睡”的数据资源,赋能实体经济数字化转型升级,加速新质生产力的形成。我国在数据资产入表、数据要素登记管理、数据知识产权进一步拓展数据资源价值化路径,并获得了创新实践成果。

数据资产制度探索和创新实践持续落地。一方面,数据资产入表落地,推动发现并确认企业数据的价值。2023年《企业数据资源相关会计处理暂行规定》《关于加强数据资产管理的指导意见》《数据资产评估指导意见》发布,逐步建立完善数据资产管理制度,明确了数据资产价值评估“无场景、不评估”的原则。在此基础上,广东、贵州、北京、浙江、湖北等多省市出台数据资产入表政策要求并推动相关实践。据不完全统计,截至2024年3月,全国已有13家城投或下属企业推动公交、供暖、供水等公共数据资产入表甚至完成融资。另一方面,数据纳入知识产权体系,作为实现数据确权的一种方式。北京、上海、江苏、浙江、福建、山东、广东、深圳8个省市开展了数据知识产权试点工作,包括上线数据知识产权登记平台,累计向经营主体颁发数据知识产权登记证书超过2000份,数据知识产权质押融资总额已超过11亿元。围绕数据资产交易、质押、信贷的实践探索已落地,丰富了数据要素在企业信贷融资场景中的应用。

数据要素登记等制度多元化探索,为实现数据资源开发利用提供保障。一方面,全国开展数据资源情况调查,摸清数据资源底数。2024年2月,国家数据局等部门联合开展全国数据资源情况调查,调研数据资源生产存储、流通交易、开发利用、安全等情况。另一方面,多地探索构建数据要素登记、管理、定价等制度。数据要素登记方面,山东、贵州等省份发布了数据要素登记管理办法或制度标准。数据资产管理方面,山东在健康医疗、地理空间等领域开展公共数据资产管理试点。数据要素定价方面,湖北等地出台了数据要素定价制度,贵阳大数据交易所探索建立“报价—估价—议价”的数据要素定价模式和价格形成机制,并研发上线了数据产品交易价格计算器。

在有效市场、有为政府的共同作用下,我国数据要素形成了多层次发展的市场格局:一是场内交易市场,数据价值实现遵循资源化、资产化、资本化的发展链路。二是数字化转型的市场,数据价值实现取决于行业和企业数字化、网络化、智能化(包括人工智能化)的进化速度,以及市场主体对于投资回报率(ROI)的评价。三是数据原生企业构成的市场,数据价值实现过程呈现出业务数字化、数字产品化和服务化的特征。三类市场运行的动力机制、价格形成机制均有较大差异,且彼此支撑、协同发展,共同对数据要素市场形成有力支撑。