Skip to content

从"流量"到"词元":第九届数字中国建设峰会观察

产业洞察 · 数字中国 · 数据要素 | 2026 年 5 月 | 约 8 分钟阅读

从"流量"到"词元":第九届数字中国建设峰会观察


2026 年 4 月 29—30 日,第九届数字中国建设峰会在福州举行。50 余场分论坛、3.3 万名创新大赛选手、超 400 家参展企业、120 余项成果发布——常规数字与上一届相比并无大差距。

真正不一样的地方,是国家把过去几年散落的政策碎片第一次拼成了完整的产业图景——并悄悄完成了一次商业逻辑的换挡:从流量驱动词元驱动

下面用四步把这场会拆开来看:先抓三个支点理解读会的方法,再看顶层范式三个具体抓手,最后把它们投影到一张四层产业地图上。


一、三个支点:本届峰会该怎么看

要看懂这届峰会,得先知道哪些信号才是真信号。三个支点比所有规模数字都更值得关注。

支点一:分论坛比主论坛更有干货。 主论坛偏战略定调,围绕"自主创新、应用牵引、生态协同、开放共赢、安全可控"展开,回答的是"做什么、为什么"。分论坛和专题活动才是真正的施工图——国家数据局局长刘烈宏在可信数据空间分论坛、高质量数据集主题交流活动密集发声,回答的是"怎么做、谁来做、用什么机制"。

支点二:刘烈宏当主持人,是一个升格信号。 他在主论坛的角色是主持人,而非主旨演讲嘉宾——这不是降级,而是国家数据局自身的角色已经在迁移:从政策制定者升格为产业生态组织者。仪式让给上层,干货塞进实施方案。

支点三:主论坛的企业嘉宾就是产业押注名单。 沐曦(GPU)、海天瑞声(语料)、宇树(具身智能)、中国联通(算力网络)——四家拼起来恰好是一条完整的国产 AI 产业链。"嘉宾选择即押注名单",比任何官方表态都更具体。

抓住这三个支点,再去看顶层范式与具体抓手,就不容易跑偏。


二、顶层范式:从流量驱动到词元驱动

本届峰会最具分量的新提法是词元驱动(Token-driven)。三个关键数字给它做了背书:

  • 截至 2026 年 3 月,中国日均词元调用量达到 140 万亿,相比 2024 年初增长超 1000 倍
  • 2025 年,AI 推理消耗的数据量首次超过训练
  • 全国已建成超过 11.6 万个高质量数据集,总体量超过 960 PB

拼在一起指向同一件事:AI 已经从"模型层的军备竞赛"迈进了"调用层的商业循环"。

"词元驱动"和"流量驱动"的差别,集中在五个维度:

维度流量时代词元时代
计价单元流量、点击、时长Token
数据需求数据规模、可获得性AI-Ready 高质量数据集
商业打法低价抢市场、补贴换规模词元定价、技术迭代驱动成本下降
关键资源用户、入口、流量分发算力 + 数据 + 模型
竞争壁垒网络效应 + 平台模型能力 + 数据资产 + 推理成本

这不是一次类比,而是官方定性。它对三个层面的玩家都意味着重写:

对政策——资源分配会重排。 "不能简单复制流量时代低价抢市场、补贴换规模的打法"——这句话的潜台词是:讲流量故事拿政府订单的窗口正在关闭,讲 Token 故事的窗口刚刚打开。

对基础设施——要重建一层"水电煤"。 围绕 Token 的计量、定价、结算、审计、合规,需要一整套新中间层。它在移动互联网时代的对应物是 CDN、API 网关、计费系统、广告归因——当年看不见,但跑出了若干头部公司。词元时代的同款赛道,正在打开。

对企业——估值故事要换语言。 靠用户规模融资、靠 DAU 算估值的故事,到 AI 阶段要换成 Token 调用量、单位 Token 经济模型、推理毛利率。讲不清这些数字的产品,下一轮融资和政府对接都会越来越吃力。

"词元驱动"目前还没正式入文,但大概率会出现在 2026 下半年的国家级文件,或者 2027 年"十五五"数字经济专项规划里。这是值得提前布局的政策关键词。


三、三个抓手:政策务实化的具体动作

顶层范式之下,国家数据局拿出了三个具体抓手。它们的共同特征,是刘烈宏罕见地"直面问题"——这本身就是政策务实化的强信号。

抓手一:可信数据空间从"建"转向"用"

可信数据空间是过去两年地方政府最热衷投建的对象。各省、各市、各行业都在建,但跑起来的不多。刘烈宏点名三大问题

重建设、轻应用;流通仍有堵点;互联互通水平亟待提升。

翻译过来就是:吹得多、用得少、互相不通。能在国家级峰会上被主管部委点名,意味着下一阶段的考核口径要变了。

紧接着的"四大行动"指向纠偏方向:以应用为牵引、以价值为导向、以产品为载体、以机制为重点,并点名 5 个优先场景:智能制造、绿色低碳、医疗健康、科技金融、信用服务。这五个就是未来 2—3 年数据要素能跑出商业闭环的"第一梯队"。

抓手二:央国企被赋予"数据流通杠杆"角色

数据要素流通过去几年的主流叙事是"建交易所、撮合交易"。但纯靠撮合的模式没跑出规模——卖方动力不足、买方场景模糊、定价机制扯皮。

最值得关注的新提法是 "订单换数据、服务换数据"。它承认一个朴素事实:业务关系比交易关系更能撬动数据共享。央国企可以在采购合同里嵌入"数据共享条款",让数据随着业务自然流动。

央国企的角色因此被悄悄重新定义——它们不只是数据持有者,也是数据流通的组织者。这也回到了 上一篇文章 讨论的"大数据集团身份之问":真正能跑出运营商角色的,是那些把"数据共享"嵌进自家业务流程里的集团,而不是空喊"运营商"招牌的玩家。

抓手三:数据资产正在金融化

刘烈宏在可信数据空间分论坛上提到,要持续完善数据要素市场化配置改革的"5+3+1"工作体系。这里的"5+3+1"不是三个条文名字的缩写,而是国家数据局对整套打法的总框:"5" 条主线(基础制度、基础设施、场景融合、一体化市场、壮大数据产业)、"3" 个基础支撑(核心技术攻关、数据标准、数字人才培养)、"1" 个重点(数据赋能人工智能创新发展)。下面这张是把公开表述结构化成一张读稿用的关系图——

数据要素市场化配置改革「5+3+1」工作体系(理解示意图,笔者自绘)

图示说明:由笔者根据 国家数据局官网转载稿《国家数据局提出的"5+3+1",到底在讲什么?》等公开材料自行绘制,仅作博文阅读辅助;国家机关发布的原版配图,政策口径以主管部门正式发布为准。

在这一套体系之下,产权登记、一体化市场、价值分配机制等政策与工程,都会往"能登记、能定价、能流通"收敛。落到企业侧的终态往往是:

数据资产入表 → 数据资产质押融资 → 数据资产证券化

一旦数据产权能登记、价值能评估、收益能分配,数据要素就具备了金融化的全部前提。对银行、会计师事务所、评估机构、地方公共数据运营平台而言,这是结构性机会,不是题材性机会。


四、产业地图:上确定,中竞争,下分散

把范式和三个抓手沿产业链横切,就得到一张四层结构。

数字中国产业地图:上游、中游、下游、服务层四层结构

上游最确定——80% 绿电、60% 枢纽集聚的硬指标已经把方向钉死,西部绿电 + 智算中心 + 国产 GPU 的组合,几乎是接下来五年最稳的赛道。

中游最竞争——百模大战还没分出胜负,数据标注、合成数据、隐私计算、Token 网关与计量这些细分赛道也都在洗牌期。政策给的是技术路线,胜负要靠模型能力和单位 Token 的经济模型。

下游最分散——智能制造、绿色低碳、医疗、金融、信用每一个都是大池子,但玩家也最多。政策给的是赛道,胜负仍要靠产品、客户和组织能力分。

服务层最被低估——数据资产入表、数据空间互联互通、Token 计量结算一旦落地,对中介服务的需求是结构性的。会计师所、合规律师、SI 集成商、标注 BPO,这些不性感但稳定的赛道,反而最值得长期关注。


结语:换挡之后的命题

把三件事放在一起看就清楚了——

  • 范式换了:流量驱动正式让位给词元驱动;
  • 抓手摆了:可信数据空间纠偏、央国企承担流通杠杆、数据资产开始金融化;
  • 地图清了:上确定、中竞争、下分散、服务被低估。

数字经济过去十年的命题是"AI 还能火多久",下一个十年的命题已经换成了:

在词元时代,你所在的环节,凭什么收 Token 的钱?

未来五年,每一家想吃数字红利的公司,都得自己回答一遍。


本文涉及数据均来自第九届数字中国建设峰会官方信息、国家数据局公开发言及配套政策文件。