《全国数据资源调查报告(2023年)》发布:数据资源六大特征展示数据要素发展方向
- 时间:2024-05-29
- 来源:亿万先生软件
内容来源:人民数据
5月24日,在第七届数字中国建设峰会“数据资源与数字安全分论坛”上,正式发布了《全国数据资源调查报告(2023年)》,这是我国首次对数据资源进行“全面体检”。
《报告》显示,我国数据资源“产—存—算”规模优势基本形成,数据“供—流—用”各环节主体逐渐丰富,海量数据和丰富场景优势潜力亟需释放,数据资源管理和利用整体处于起步阶段。
当前,我国数据资源有以下几个特征:
01、数据生产规模大,范围广,增长速度快
我国数据生产规模持续扩大。2023年数据生产总量达到32.85泽字节(ZB),同比增长22.44%,非结构数据爆发式增长。随着5G、AI技术的快速发展及智能设备的规模应用,内容创作、影像视听等非结构数据对我国数据总规模增长贡献较大,消费民生领域新业态不断涌现,满足了人们不断增长的文化娱乐消费需求。
智慧城市扩大物联感知范围。公共数据获取范围不断扩大,设施物联传感数据占比超40%。城市各种基础设施、资源、服务等加速数字化、网络化、智能化升级,摄像头、传感器、无线设备等相互连接形成城市的“神经脉络”,实时捕捉城市交通、人流等各种信息,推动海量数据从大街小巷汇入城市大脑。
智能应用推动数据产量提速。随着技术的创新突破以及硬件的迭代更新,生产生活的数字化应用逐渐增加,推动我国数据产量快速增长。在生活方面,智能网联车驱动车、路、网、云数据快速交换,出行数据同比增幅达到49%。在生产方面,老旧生产设备的升级改造以及智能边缘设备、工业机器人、数控机床等智能设备的推广应用,推动生产制造数据同比增幅达到20%。
02、数据存储空间合理,终端存储高于云存储,产存转化待提升
存储总空间基本满足存储需求。2023年我国累计数据存储总量为1.73泽字节(ZB),存储空间利用率为59%。其中政府和行业重点企业存储空间利用率均为70%左右。数据服务商对存储空间提前布局,存储空间利用率为35.29%。随着企业算力的不断提升,对数据存储除性能要求外,更需高扩展性来为海量数据“矿产”的挖掘做准备。
数据终端存储高于云存储。数据云存储占比约超过40%,其中,行业重点企业云存储占比为23.49%。云存储高灵活性和高便捷性优势有效支撑了业务协同带来的数据交互需求。行业重点企业数据终端存储占比超七成,海量数据被分散存储,数据互联、复用难度较大,但边缘智能化一定程度上能促进数据从存向用转化。
数据产存转化率较低。2023年新增数据存储量为0.95泽字节(ZB),与年数据生产总量相比,占比为2.9%,数据价值潜力有待进一步挖掘。一方面海量数据复用价值较低,大部分过程类数据产生后即被丢弃、覆盖。另一方面大模型、训练工具等支撑能力不足,海量数据开发利用价值低于存储成本,部分高价值数据在“大浪淘沙”过程中被遗弃。
03、算力规模增长快,区域算力按需布局,智算能力需求旺
算力中心规模持续增长,算力建设仍需适度超前布局。至2023年底,2200多个算力中心的算力规模约为0.23十万亿亿次浮点运算/秒(ZFLOPS),同比增长约为30%。与此同时,大模型训练算力需求高涨,科学、政务、金融、工业等行业算力需求随之增加,一体化算力体系建设仍需加快推进,保持适度超前布局。
区域算力按需布局,东西部算力协同仍待发展。一方面,算力枢纽按需布局趋势明显。东部地区实时计算需求增幅较大,实时数据处理仍依赖于本地算力。京津冀、长三角、珠三角地区算力规模占比达58.61%。另一方面,东数西算仍需进一步发展。西部地区凭借绿色化和低成本的算力优势逐步承接东部计算需求。如影视制作企业、云服务商等借助西部算力中心大幅缩减成本。然而西部地区存算利用率仍然低于东部地区。
大模型需求不断增加,智算支撑能力仍需提升。至2023年我国智能算力占比约为30%,各行业各领域对智能算力的需求日趋强烈,而能够支撑行业垂直领域大模型落地的算力不足,大模型与国产软硬件的适配性问题尚需解决。
04、数据流通方式多元,交互能力有提升,交易供需不均衡
消费领域数据交互活跃度较高。2023年,四大运营商数据显示全国数据总流量较去年同期增长7.6%,数据流量保持稳步增长。随着汽车、家居、穿戴等智能终端品类不断丰富和声像视听数据交互需求持续增加,移动互联网数据流通活跃度不断增加。
平台和央企数据流通量远超其他企业。中央企业和平台企业成为行业领域的数据枢纽,在各自领域探索交互机制。本次调查中,平台企业平均数据交互量为行业重点企业的249倍,各行业数据正逐渐向平台聚拢。SaaS服务模式日益成熟,平台提供数据产品中SaaS化产品占比超五成,订阅式交易占比逐年增多。中央企业成为产业链数据枢纽。本次调查中,中央企业平均数据交互量为行业重点企业的42倍。链主企业正在通过产业链协同赋能上下游企业,汇聚全产业链数据。
交易机构加快建设,场内交易吸引力不足。全国各地交易所快速铺开,19个省市建立数据交易机构。上海、浙江、深圳、海南等地数据交易机构“百花齐放”,交易模式、数商生态、技术底座各具特色。交易机构在标准、规则方面尚未达成共识,场内交易吸引力不足。
数据交易机构供给水平难以满足旺盛的数据需求。数据需求快速增长,制造业、信息服务、批发零售等行业数据需求量较大。与此同时,交易机构数据产品成交率不高。27家交易所上架数据产品中仅有17.9%实现交易,数据场内交易活跃度较低。例如,消费民生领域数据产品购买方数量是供给方的2.4倍,但产品成交率不足一成,存在供需不匹配的现象。
05、公共数据开放共享初见成效,授权运营起步探索,政企数据融合不断深入
公共数据体系完善,数据汇聚能力不断提升。截至2023年12月底,全国一体化政务数据枢纽接入53个国家部门、31个省/自治区/直辖市和新疆生产建设兵团数据,挂接资源达2.06万个,实现累计调用5361.35亿次服务。
公共数据开放共享提升政务服务水平。国家行业主管部门、地方省级政府开放数据量比上年增长16%、18.5%。高频政务服务事项实现“一网通办”“跨省通办”,逐步向标准化服务发展,电子证照、身份识别等已实现数据全国协同。公共数据共享满足率仅在少数应用场景得到满足,但大多数需求场景暂不明确的领域,与应用解耦的基础类数据,还需进一步提升数据共享效率。
公共数据授权运营机制正初步探索。人力资源和社会保障部、文化和旅游部、国家市场监督管理总局、国家卫生健康委等国家部委开展了公共数据授权运营。北京、浙江、上海、重庆等15个地区的省级数据管理部门开始探索公共数据授权运营机制。公共数据应用场景主要为公共服务和社会管理。公共数据与企业数据加深融合应用。
公共数据在数据开发利用、流通交易中占比较大。平台企业、数据分析企业对公共数据需求高涨。本次调查中,有18.6%的平台企业和51%的中央企业在数据开发利用过程中应用到政府开放数据。工商、气象、交通、地理等公共数据广泛应用于数据开发利用中,成为释放数据价值的催化剂。
06、数字化转型激活企业数据,场景应用提质增效,数据外溢效应仍不足
数字化转型沉淀海量数据,数据应用场景加速落地。随着数字化转型深入推进,企业获取数据的能力显著提升。企业积极开展数据应用,海量数据加速融入生产运营各类场景。本次调查中,96%的行业重点企业已实现数据场景化应用,其中超8成行业重点企业已经运用数据辅助运营管理优化,半数企业在生产环节实现数据驱动。
数据管理和复用水平较低,多主体数据协同难度大。企业普遍重数据设施和项目建设、轻数据资源管理,本次调查中,21.9%的大企业尚未建设数据管理系统,大多数中小企业数字化转型产生的数据未实现复用。数据多场景、多主体协同难度大。本次调查中,开展产业链协同应用的企业占比不足20%,通过产业链数据实现风险预测的应用占比约为10%。
企业数字化投入较高,数据价值外溢效应尚不明显。我国企业数字化投入积极性较高。本次调查中,2023年有数字化投入的行业重点企业占比超8成。企业对数据价值认识和判断不足,数据增值的投入和能力有限,开展数字化转型的大型行业重点企业中,仅有8.3%实现了数据复用增值,数据价值有待进一步释放。
全国数据资源调查工作验证了我国发展数字经济具备超大规模市场、海量数据资源和丰富应用场景潜在优势。