Skip to content

从“可用”到“可信”:信通院 2026 智能体十大关键词里藏着的产业拐点

行业观察 · 智能体 × 产业落地 × 工程化治理 | 约 11 分钟阅读

信通院 2026 智能体十大关键词:从可用到可信的产业拐点

2026 年 6 月 9 日,中国信通院在"智能体高质量发展研讨会"上正式发布了"2026 智能体十大关键词",由信通院人工智能研究所平台与工程化部主任曹峰做了解读,6 月 18 日对外公开。这不是第一次——2025 年 7 月信通院就在 WAIC 上发过一版,按官方说法,那一版的判断在过去一年的产业实践里"得到持续验证"。

所以这份榜单的真正看点,不是某个词有多新,而是整份榜单透露出的那句总判断:智能体正从"可用",迈向"可进化、可协作、可信任"。换句话说,行业的注意力正在从"能不能跑起来",整体迁移到"能不能规模化、能不能信得过"。

一、先看全景:十个词其实在讲四件事

十个关键词如果平铺直叙地一个个念,很容易记不住、也看不出门道。我更愿意把它们重新归一下类——它们分别对应智能体落地的四个层次:地基、能力、价值、治理

官方全称均带"智能体"前缀(如"智能体基础设施"),下表为简洁省略,仅保留核心词。

层次关键词信通院的定位比喻一句话理解
地基基础设施硅基孵化器从算力到治理的一体化底座
地基互联协作生态基座让单体 agent 走向群体协同
地基工程化生产级引擎从 PoC 到规模化的全生命周期闭环
能力学习进化成长飞轮用动态闭环替代静态能力预设
能力记忆经验仓库跨会话、跨任务的上下文与经验复用
能力技能能力原子库把操作/规则/知识封装成可组合单元
价值产品创新数字伙伴从对话入口走向全链路产品形态
价值支付协议交易枢纽让 agent 成为能自主交易的主体
治理可信信任基石可靠生成、可控执行、责任可追溯
治理全栈评估度量衡器衡量能不能落地、值不值得投

这张表是这篇文章的骨架。下面四节,就沿着这四层往下讲——每一层在解决一个什么样的真问题。

二、地基层:先把"规模化"的地基铺平

排在最前面的三个词——基础设施、互联协作、工程化——本质上都在回答同一个问题:智能体要从零星试点走向大规模生产,缺的到底是什么。

智能体基础设施被排在第一位,信号很明确。过去大家谈智能体,焦点都在模型本身够不够聪明;而信通院把"基础设施"提到首位,等于说瓶颈已经从模型转移到了支撑体系。它的内涵很宽:底下是算力、存储、网络这些资源底座,中间是沙箱、开发框架、部署平台、运行环境这些工程化支撑,再往上是模型接入、记忆管理、工具调用、技能编排、任务调度、状态管理这些关键组件,最外面还包了一层可观测、可评测、可审计、安全隔离、权限控制的治理机制。一句话,当智能体要处理高并发、长时程、多工具、多权限的复杂任务时,临时搭的环境撑不住,必须有一套标准化、模块化、云边协同的底座。

智能体互联协作讲的是另一件事:单个 agent 再强也有天花板,真正的产业价值在群体协同。它强调通过标准接口、协作协议和任务编排,让不同的智能体、模型、工具、业务系统能互联互通、分工协作,还要在身份管理、权限控制、安全审计的保障下形成可靠的协作网络。这背后其实呼应了过去一年很火的多智能体、agent 间协议(比如各种 A2A、MCP 之类的努力)——行业已经意识到,智能体的下半场是"网络",不是"单点"。

智能体工程化则是这一层里最接地气的一个词,也是我个人觉得分量最重的。它直面的是所有人都踩过的坑:demo 很惊艳,一上生产就翻车。原因在于智能体天生"目标开放、路径动态、结果不确定",没法像传统软件那样靠确定性流程兜底。信通院给的解法是构建覆盖需求分析、架构设计、开发构建、测试验证、部署运行、监测优化、成本评估的全生命周期闭环,核心是两件事:一是把模型、工具、技能、流程、知识沉淀成可复用资产,二是用标准流程、运行监控、效果评估、持续优化做到"可重复、可观测、可优化"。这跟这个博客一直在聊的 Harness 工程、Agentic Data Engineering 是同一个方向——智能体的竞争力,越来越多地落在工程化能力上,而不是模型调用本身。

三、能力层:让智能体从"听指令"变成"会成长"

中间三个词——学习进化、记忆、技能——拼起来是一幅完整的"能力升级"图景:智能体要从被动执行指令,变成能自我成长的系统。

智能体成长飞轮:感知—规划—执行—反馈闭环,靠经验反思、记忆重构、策略更新实现从指令驱动到自我成长

智能体学习进化点出的核心转变是:用动态闭环优化,替代静态能力预设。过去的 agent 能力是"出厂即定型",发布时是什么样就是什么样;而学习进化要求它在与环境、用户、任务的持续交互中,通过经验反思、记忆重构、策略更新不断提升,实现从"指令驱动"到"自我成长"的跨越。这是一个很高的目标,目前业界离真正的持续自我进化还有距离,但方向已经立在那儿了。

而要"成长",前提是能"记住",这就是智能体记忆。它和传统系统里的静态存储不是一回事——它管的是交互历史、任务状态、用户偏好、环境反馈、执行经验这些动态信息,既要支持单次任务里的上下文追踪,也要支撑跨会话、跨任务的经验沉淀与复用。关键机制包括信息存储、语义检索、记忆更新、内容压缩、主动遗忘和权限治理。注意"主动遗忘"和"权限治理"这两个词,说明记忆不只是"存得越多越好",还涉及合规和安全——记忆一旦跨任务复用,隐私边界就成了硬约束。

智能体技能则解决"会不会干活"的问题。它把任务执行中的具体操作、业务规则、专业知识抽象封装成可调用、可组合、可复用的单元,让智能体不再只依赖模型生成结果,而是能调用检索、分析、计算、生成、系统操作、设备控制等外部能力,并结合场景约束、执行反馈、安全规则做动态编排。说白了:重复任务标准化、业务规则结构化、行业知识工具化。眼熟吗?这跟 Anthropic 力推的 Skill、各家在做的工具/技能体系完全是一条路——智能体的能力,正在被拆成一个个可拼装的"原子"。

四、价值层:从"对话入口"到"交易主体"

如果说前两层是"练内功",那产品创新和支付协议这两个词,讲的就是智能体怎么真正产生商业价值。

智能体产品创新标志着应用从功能验证走向产品化、服务化。信通院用了"养虾""养马"这种带点烟火气的说法来形容当下的实践热潮,更实在的是它点出新一代智能体已经不再局限于问答,而是初步具备任务理解、流程调度、工具调用、系统操作能力,能打通从用户交互到任务执行、从前端入口到后台系统的完整链路。智能助手、智能客服、数字员工这些形态正在铺开,智能体正在变成"连接用户、场景与服务的数字伙伴"。

真正让我眼前一亮的是智能体支付协议。这是一个相对新、也相对超前的词。它要解决的是一个很现实的问题:当智能体要自主交易、调用付费服务、做价值交换时,传统支付体系根本没为它设计——主体资格受限(agent 算不算交易主体?)、责任归属模糊(出了事算谁的?)、动态条款适配不足。支付协议要做的,是为跨平台、跨终端的智能体协作,提供身份识别、权限授权、服务交互、自动结算、信任保障的标准化支撑,推动智能体"从信息流转节点,向交易执行主体演进"。这句话的含金量很高——它指向的是一个全新的"agent 经济":当智能体能自己花钱、自己结算,机器与机器之间的交易规模可能会迎来一次爆发。这也和这个博客之前聊过的"agent-to-agent 下一轮量级爆发"对得上。

智能体支付协议:身份识别—权限授权—服务交互—自动结算—信任保障,让智能体从信息节点变成交易主体

五、治理层:可信和评估,才是规模化的真正门槛

最后两个词——可信、全栈评估——被放在压轴,恰恰说明了整份榜单的态度:能力再强,过不了"信任"和"度量"这两关,就谈不上规模化。

智能体可信是规范落地的前提。信通院说得很直白:随着智能体从信息问答走向任务执行,它参与的业务链条更长、调用的外部资源更多、产生的现实影响更直接,于是知识来源不稳定、行为边界不清晰、执行过程不可控、决策路径不透明、结果难验证、责任难追溯这些问题全冒出来了。它给的解法是数据、技术、评估三方面协同:以高质量数据供给和知识治理夯实专业可靠性,以可信推理、权限控制、行为约束、风险防护保障执行可控性,以多维评估和风险监测实现持续改进。这里"高质量数据"又一次被放在可信的根基位置——这跟我一直关注的高质量数据集治理是同一个落点。

智能体全栈评估则是给整个产业装上一把"尺子"。它和模型评测不是一回事:模型评测看模型本身,而智能体评估要覆盖任务理解、规划推理、工具调用、执行反馈、稳定性、安全性、用户体验等全链路。更关键的是它分了三个层次——能力评估(任务完成质量、复杂任务处理、行业适配)、价值评估(用户体验、业务贡献、战略匹配)、效益评估(自动化水平、效率提升、成本优化、投资回报)。信通院还提到自家的"方升"智能体基准测试正在围绕这套方法推进。对企业决策者来说,这三层尤其有用:它把"这个 agent 到底值不值得投"从拍脑袋变成了可量化的判断。

结论

把十个词读完,几个判断可以带走:

第一,产业的主线变了。从 2025 到 2026,智能体的焦点已经从"模型够不够强"转移到"基础设施、工程化、可信、评估"这些更"重"、更工程、更治理的环节。比拼模型的阶段在过去,比拼落地体系的阶段在到来。

第二,真正的护城河在地基层和治理层,而不是某个炫酷的能力点。基础设施、工程化、可信、全栈评估这四个词,决定了一家公司能不能把智能体规模化地、稳定地、可信地用起来——这恰恰是大多数团队最薄弱的地方。

第三,"支付协议"是最值得提前下注的方向。当智能体从对话入口变成能自主交易的主体,一个机器对机器的"agent 经济"正在成形,这里面藏着新的基础设施级机会。

第四,高质量数据始终是底座。无论是可信、记忆,还是评估,信通院反复把"高质量数据供给与治理"放在根基位置——这一点对做数据工程的人是个长期利好。

最后留个问题给你:如果对照这四层(地基、能力、价值、治理)盘一盘你自己团队的智能体实践,你会发现自己卡在了哪一层?是地基没铺平,还是过不了可信与评估这道门槛?