从“可用”到“可信”:信通院 2026 智能体十大关键词里藏着的产业拐点
行业观察 · 智能体 × 产业落地 × 工程化治理 | 约 11 分钟阅读

2026 年 6 月 9 日,中国信通院在"智能体高质量发展研讨会"上正式发布了"2026 智能体十大关键词",由信通院人工智能研究所平台与工程化部主任曹峰做了解读,6 月 18 日对外公开。这不是第一次——2025 年 7 月信通院就在 WAIC 上发过一版,按官方说法,那一版的判断在过去一年的产业实践里"得到持续验证"。
所以这份榜单的真正看点,不是某个词有多新,而是整份榜单透露出的那句总判断:智能体正从"可用",迈向"可进化、可协作、可信任"。换句话说,行业的注意力正在从"能不能跑起来",整体迁移到"能不能规模化、能不能信得过"。
一、先看全景:十个词其实在讲四件事
十个关键词如果平铺直叙地一个个念,很容易记不住、也看不出门道。我更愿意把它们重新归一下类——它们分别对应智能体落地的四个层次:地基、能力、价值、治理。
官方全称均带"智能体"前缀(如"智能体基础设施"),下表为简洁省略,仅保留核心词。
| 层次 | 关键词 | 信通院的定位比喻 | 一句话理解 |
|---|---|---|---|
| 地基 | 基础设施 | 硅基孵化器 | 从算力到治理的一体化底座 |
| 地基 | 互联协作 | 生态基座 | 让单体 agent 走向群体协同 |
| 地基 | 工程化 | 生产级引擎 | 从 PoC 到规模化的全生命周期闭环 |
| 能力 | 学习进化 | 成长飞轮 | 用动态闭环替代静态能力预设 |
| 能力 | 记忆 | 经验仓库 | 跨会话、跨任务的上下文与经验复用 |
| 能力 | 技能 | 能力原子库 | 把操作/规则/知识封装成可组合单元 |
| 价值 | 产品创新 | 数字伙伴 | 从对话入口走向全链路产品形态 |
| 价值 | 支付协议 | 交易枢纽 | 让 agent 成为能自主交易的主体 |
| 治理 | 可信 | 信任基石 | 可靠生成、可控执行、责任可追溯 |
| 治理 | 全栈评估 | 度量衡器 | 衡量能不能落地、值不值得投 |
这张表是这篇文章的骨架。下面四节,就沿着这四层往下讲——每一层在解决一个什么样的真问题。
二、地基层:先把"规模化"的地基铺平
排在最前面的三个词——基础设施、互联协作、工程化——本质上都在回答同一个问题:智能体要从零星试点走向大规模生产,缺的到底是什么。
智能体基础设施被排在第一位,信号很明确。过去大家谈智能体,焦点都在模型本身够不够聪明;而信通院把"基础设施"提到首位,等于说瓶颈已经从模型转移到了支撑体系。它的内涵很宽:底下是算力、存储、网络这些资源底座,中间是沙箱、开发框架、部署平台、运行环境这些工程化支撑,再往上是模型接入、记忆管理、工具调用、技能编排、任务调度、状态管理这些关键组件,最外面还包了一层可观测、可评测、可审计、安全隔离、权限控制的治理机制。一句话,当智能体要处理高并发、长时程、多工具、多权限的复杂任务时,临时搭的环境撑不住,必须有一套标准化、模块化、云边协同的底座。
智能体互联协作讲的是另一件事:单个 agent 再强也有天花板,真正的产业价值在群体协同。它强调通过标准接口、协作协议和任务编排,让不同的智能体、模型、工具、业务系统能互联互通、分工协作,还要在身份管理、权限控制、安全审计的保障下形成可靠的协作网络。这背后其实呼应了过去一年很火的多智能体、agent 间协议(比如各种 A2A、MCP 之类的努力)——行业已经意识到,智能体的下半场是"网络",不是"单点"。
智能体工程化则是这一层里最接地气的一个词,也是我个人觉得分量最重的。它直面的是所有人都踩过的坑:demo 很惊艳,一上生产就翻车。原因在于智能体天生"目标开放、路径动态、结果不确定",没法像传统软件那样靠确定性流程兜底。信通院给的解法是构建覆盖需求分析、架构设计、开发构建、测试验证、部署运行、监测优化、成本评估的全生命周期闭环,核心是两件事:一是把模型、工具、技能、流程、知识沉淀成可复用资产,二是用标准流程、运行监控、效果评估、持续优化做到"可重复、可观测、可优化"。这跟这个博客一直在聊的 Harness 工程、Agentic Data Engineering 是同一个方向——智能体的竞争力,越来越多地落在工程化能力上,而不是模型调用本身。
三、能力层:让智能体从"听指令"变成"会成长"
中间三个词——学习进化、记忆、技能——拼起来是一幅完整的"能力升级"图景:智能体要从被动执行指令,变成能自我成长的系统。

智能体学习进化点出的核心转变是:用动态闭环优化,替代静态能力预设。过去的 agent 能力是"出厂即定型",发布时是什么样就是什么样;而学习进化要求它在与环境、用户、任务的持续交互中,通过经验反思、记忆重构、策略更新不断提升,实现从"指令驱动"到"自我成长"的跨越。这是一个很高的目标,目前业界离真正的持续自我进化还有距离,但方向已经立在那儿了。
而要"成长",前提是能"记住",这就是智能体记忆。它和传统系统里的静态存储不是一回事——它管的是交互历史、任务状态、用户偏好、环境反馈、执行经验这些动态信息,既要支持单次任务里的上下文追踪,也要支撑跨会话、跨任务的经验沉淀与复用。关键机制包括信息存储、语义检索、记忆更新、内容压缩、主动遗忘和权限治理。注意"主动遗忘"和"权限治理"这两个词,说明记忆不只是"存得越多越好",还涉及合规和安全——记忆一旦跨任务复用,隐私边界就成了硬约束。
智能体技能则解决"会不会干活"的问题。它把任务执行中的具体操作、业务规则、专业知识抽象封装成可调用、可组合、可复用的单元,让智能体不再只依赖模型生成结果,而是能调用检索、分析、计算、生成、系统操作、设备控制等外部能力,并结合场景约束、执行反馈、安全规则做动态编排。说白了:重复任务标准化、业务规则结构化、行业知识工具化。眼熟吗?这跟 Anthropic 力推的 Skill、各家在做的工具/技能体系完全是一条路——智能体的能力,正在被拆成一个个可拼装的"原子"。
四、价值层:从"对话入口"到"交易主体"
如果说前两层是"练内功",那产品创新和支付协议这两个词,讲的就是智能体怎么真正产生商业价值。
智能体产品创新标志着应用从功能验证走向产品化、服务化。信通院用了"养虾""养马"这种带点烟火气的说法来形容当下的实践热潮,更实在的是它点出新一代智能体已经不再局限于问答,而是初步具备任务理解、流程调度、工具调用、系统操作能力,能打通从用户交互到任务执行、从前端入口到后台系统的完整链路。智能助手、智能客服、数字员工这些形态正在铺开,智能体正在变成"连接用户、场景与服务的数字伙伴"。
真正让我眼前一亮的是智能体支付协议。这是一个相对新、也相对超前的词。它要解决的是一个很现实的问题:当智能体要自主交易、调用付费服务、做价值交换时,传统支付体系根本没为它设计——主体资格受限(agent 算不算交易主体?)、责任归属模糊(出了事算谁的?)、动态条款适配不足。支付协议要做的,是为跨平台、跨终端的智能体协作,提供身份识别、权限授权、服务交互、自动结算、信任保障的标准化支撑,推动智能体"从信息流转节点,向交易执行主体演进"。这句话的含金量很高——它指向的是一个全新的"agent 经济":当智能体能自己花钱、自己结算,机器与机器之间的交易规模可能会迎来一次爆发。这也和这个博客之前聊过的"agent-to-agent 下一轮量级爆发"对得上。

五、治理层:可信和评估,才是规模化的真正门槛
最后两个词——可信、全栈评估——被放在压轴,恰恰说明了整份榜单的态度:能力再强,过不了"信任"和"度量"这两关,就谈不上规模化。
智能体可信是规范落地的前提。信通院说得很直白:随着智能体从信息问答走向任务执行,它参与的业务链条更长、调用的外部资源更多、产生的现实影响更直接,于是知识来源不稳定、行为边界不清晰、执行过程不可控、决策路径不透明、结果难验证、责任难追溯这些问题全冒出来了。它给的解法是数据、技术、评估三方面协同:以高质量数据供给和知识治理夯实专业可靠性,以可信推理、权限控制、行为约束、风险防护保障执行可控性,以多维评估和风险监测实现持续改进。这里"高质量数据"又一次被放在可信的根基位置——这跟我一直关注的高质量数据集治理是同一个落点。
智能体全栈评估则是给整个产业装上一把"尺子"。它和模型评测不是一回事:模型评测看模型本身,而智能体评估要覆盖任务理解、规划推理、工具调用、执行反馈、稳定性、安全性、用户体验等全链路。更关键的是它分了三个层次——能力评估(任务完成质量、复杂任务处理、行业适配)、价值评估(用户体验、业务贡献、战略匹配)、效益评估(自动化水平、效率提升、成本优化、投资回报)。信通院还提到自家的"方升"智能体基准测试正在围绕这套方法推进。对企业决策者来说,这三层尤其有用:它把"这个 agent 到底值不值得投"从拍脑袋变成了可量化的判断。
结论
把十个词读完,几个判断可以带走:
第一,产业的主线变了。从 2025 到 2026,智能体的焦点已经从"模型够不够强"转移到"基础设施、工程化、可信、评估"这些更"重"、更工程、更治理的环节。比拼模型的阶段在过去,比拼落地体系的阶段在到来。
第二,真正的护城河在地基层和治理层,而不是某个炫酷的能力点。基础设施、工程化、可信、全栈评估这四个词,决定了一家公司能不能把智能体规模化地、稳定地、可信地用起来——这恰恰是大多数团队最薄弱的地方。
第三,"支付协议"是最值得提前下注的方向。当智能体从对话入口变成能自主交易的主体,一个机器对机器的"agent 经济"正在成形,这里面藏着新的基础设施级机会。
第四,高质量数据始终是底座。无论是可信、记忆,还是评估,信通院反复把"高质量数据供给与治理"放在根基位置——这一点对做数据工程的人是个长期利好。
最后留个问题给你:如果对照这四层(地基、能力、价值、治理)盘一盘你自己团队的智能体实践,你会发现自己卡在了哪一层?是地基没铺平,还是过不了可信与评估这道门槛?