当知识溶进权重：AI 时代知识产权的范式之问

产业洞察 · 知识产权 × AI × 工业软件 | 2026 年 5 月 | 约 14 分钟阅读

上一篇《工业克苏鲁》写完之后，有一个问题一直没放下：

如果工业基座要从"软件 + 硬件"翻成"数据 + 模型 + AI"——那保护这些资产的 知识产权制度，是不是也得跟着翻一遍？

越想越觉得，这不是一个"修修补补就能应付"的问题。更像是 知识本身换了容器，而我们还在用旧容器的尺子去量新容器。

这篇不下结论——因为全世界都还没有答案。只想把问题摆出来，看看能不能帮自己想清楚一点。

一、旧框架：三把锁够用了吗？

传统软件的知识产权，大体靠 三把锁：

锁	保护的对象	核心逻辑
著作权（版权）	代码的"文字表达"	你写的代码是你的"作品"，别人不能抄
专利权	算法 / 方法 / 装置	你发明了一种新方法，20 年内别人不能用
商业秘密	未公开的 know-how	你的配方、工艺参数没公开，别人偷了要赔

这三把锁在传统软件时代跑了几十年，大体够用。原因很简单：价值的载体是代码——代码是人写的、可以文字化的、有明确归属的。

但 AI 时代，价值的重心漂移了。漂到哪儿了？

二、三次漂移：价值不再住在代码里

三次漂移：AI 时代的价值重心转移——从代码到数据、从人的创作到人机共创、从静态资产到动态能力

漂移一｜从"代码"到"数据"

传统工业软件的价值链很清晰：写代码 → 打包成软件 → 卖 license。代码就是资产，保护代码就是保护资产。

但现在，一个工业 AI 模型的价值可能是这样构成的：

构成	价值占比（直觉估计）	现有 IP 保护
模型架构（代码）	10–20%	版权 + 专利（勉强覆盖）
训练数据	40–60%	几乎空白
训练方法 / 超参数	10–20%	商业秘密（但难举证）
推理部署工程	10%	商业秘密

价值构成对比：传统工业软件 vs AI 原生工业软件——左边旧锁基本罩得住，右边大半落在旧锁的缝隙里

价值的大头已经从代码搬到了数据上，但数据恰恰是三把锁最锁不住的东西：

版权：原始数据通常不构成"作品"（一组温度传感器读数，很难说有"独创性"）；
专利：数据不是"技术方案"；
商业秘密：能保护，但数据一旦喂进模型训练，know-how 就 溶解在了权重里——你很难证明对方模型里"含有"你的数据。

这让我想到一个比喻：数据像盐，溶进了汤里。你知道汤是咸的，但你拿不出那粒盐。

漂移二｜从"人的创作"到"人机共创"

版权法和专利法有一个共同的底层假设：创作 / 发明的主体是自然人。

这个假设在 AI 时代开始松动：

AI 生成代码：GitHub Copilot 写的代码，版权归谁？程序员？微软？OpenAI？还是训练数据的原始作者？
AI 辅助发明：如果一个 AI 模型在做 CFD 仿真时"发现"了一种新的翼型设计，专利申请表上"发明人"一栏填谁？
AI 生成工业设计：大模型根据工艺约束自动生成的模具方案，算不算"作品"？

目前各国的态度不一样，但都很尴尬：

司法管辖	对"AI 能否做发明人/作者"的态度	实际效果
美国 USPTO / 版权局	明确拒绝：只有自然人能做发明人和作者	AI 生成的内容 = 公共领域？
欧洲 EPO	拒绝 AI 发明人（DABUS 案）	同上
中国	态度相对开放：北京互联网法院 2023 年判决认定 AI 生成图片可受版权保护（需有人的智力投入）	但边界仍模糊
英国	现行法允许"计算机生成作品"有版权（1988 年 CDPA）	全球少数例外

有意思的是，越是拒绝 AI 做作者/发明人的司法体系，反而越可能让 AI 生成的成果落入公共领域——这对投入大量资源训练模型的企业来说，恰恰是一种反激励。

漂移三｜从"静态资产"到"动态能力"

传统软件是 静态资产：写完了就固定了，版本号锁死，IP 边界清晰。

但 AI 模型是 动态能力：它在持续学习、持续微调、持续被新数据改变。一个工业大模型今天和三个月后可能已经是"不同的模型"——但它的 IP 归属并没有跟着变。

更有意思的问题是：如果模型在使用过程中通过用户反馈变得更好了，新增的价值归谁？

SaaS 模式下，用户的使用数据反哺了模型 → 模型变好 → 服务所有用户。
用户有没有对"自己贡献的那部分改进"主张权利的基础？

这个问题目前没有任何法律框架能回答。

三、矛盾在哪里爆发？三个视角

三次漂移还停留在抽象层面。把镜头拉近到具体场景，就能看到矛盾正在 三个不同主体身上同时爆发——巨头、散户、防御策略——三者加起来，才是这个范式之问的完整切片。

视角一｜巨头视角：知识层的悖论

先看《工业克苏鲁》里那个判断：

下半场要做的，是把知识从外资软件里拆出来，装进中国数据 + 模型。

理论上很美好。但落到三一重工这种企业身上，这是一道死循环：

它 30 年的工艺数据是最宝贵的资产；
要让这些数据发挥价值，就得拿出来训练工业大模型；
模型一旦训练完成，数据里的 know-how 就溶进了权重——拿不出来，也证不了；
如果这个模型又被用来服务其他客户，三一的知识就在 无形中被稀释。

更糟的是，这种稀释会沿着《工业克苏鲁》里的"设计 ↔ 制造 ↔ 运营 ↔ 服务"闭环不断放大：每一次数据跨越组织边界，IP 归属就模糊一层。车厂的行驶数据喂给 AI 优化下一版设计，模型 IP 归车厂还是 AI 供应商？供应商的工艺数据通过平台共享给整车厂的模型吸收，谁能主张什么权利？

商业层的换挡也在加剧这个问题。《从"流量"到"词元"》里讲过模式正从"卖 license"转向"按词元计费"——但用户买的不再是软件拷贝（版权能罩住），而是模型的推理能力（没有任何 IP 类别能罩住）。整个"词元经济"的价值链上，几乎每个环节都落在现有 IP 框架的缝隙里。

一句话收口：没有一套可信的产权框架，谁敢把自己的核心工艺数据拿出来？ 这或许是"二次重构"最大的隐性障碍——不是技术问题，不是商业问题，是 制度问题。

视角二｜散户视角："智力佃农"问题

巨头的困境只是故事的一半。如果只看到三一重工，视角还不够深——被溶进权重的，远不止巨头的工艺数据。

想想另一端：

数百万程序员写的开源代码，被抓去训练了 Copilot；
几十万画师的作品，被 Stable Diffusion 学了个遍；
工厂里的老师傅，一辈子的工艺手感被录成操作视频，喂给了工业大模型。

这些人贡献了"盐"，但他们连"汤"的味道都分不到。

表面上看，"知识溶进权重"是知识的平民化——AI 让人人都能用上过去只有专家才有的能力。但硬币的背面是 产权的中心化：知识从千万个分散的个体手中流向几个大模型平台，变成了平台的资产。

这不是新故事。互联网时代，用户数据喂肥了平台；AI 时代，用户的 智力成果 在喂肥模型。只不过这一次，被收割的不是注意力，而是 创造力本身。

如果新的 IP 制度只保护"有能力训练大模型的一方"——也就是有算力、有数据管线、有工程团队的巨头——那些贡献了原始知识的个体和中小企业，就会变成 AI 时代的 "智力佃农"：在别人的模型上耕种，但永远拿不到地契。

任何新制度如果不回答"散户的盐怎么定价"，就只是在帮大厂修围墙。

视角三｜策略视角：防御性专利库的终结？

巨头守不住自己的数据，散户分不到自己的果实——还有第三个被搅动的，是过去几十年大公司赖以生存的 防御性 IP 策略。

工业领域的专利，主要不是为了进攻，而是为了 互换授权——"你不告我，我不告你"。这套博弈之所以成立，前提是 专利边界清晰、侵权可以指认。

但在 AI 时代，"盐溶于水"让这个前提塌了：

你的算法专利被 AI 模型"学"走了，但模型的权重矩阵里 找不到任何一段代码能和你的专利权利要求一一对应；
你的工艺 know-how 被训练数据吸收了，但你 无法证明对方模型的输出"源于"你的数据；
对方甚至可以说模型是自己"独立发现"的——而你无法反驳。

如果防御性专利库的威慑力大幅衰减，那未来的 IP 护城河可能不再是"我有多少专利"，而是 "我有多少无法被离线复制的实时动态数据流"。

换句话说，IP 竞争可能从 "静态资产库的比拼" 转向 "动态系统准入的争夺"——谁能持续接入最丰富的实时数据管道，谁的模型就能持续领先，而这种领先 不需要专利来保护，因为它根本无法被静态地"偷走"。

这或许能解释为什么那些 AI 领先的公司并不急于申请海量专利，而是拼命在做 数据飞轮和生态锁定——它们可能已经直觉地感知到：旧的防御武器不好使了，新的护城河长在别处。

三视角合一

三视角合一·三把锁同时失灵：巨头的商业秘密、散户的著作权、科技巨头的专利权同时面临失效

把三个视角叠在一起，能看到一幅完整的图景：

视角	谁在受冲击	旧框架的失灵点
巨头视角	三一、宁德、车厂等数据持有方	数据贡献无法确权，模型被稀释
散户视角	程序员、画师、老师傅、中小企业	智力成果被无偿吸收，沦为"佃农"
策略视角	拥有专利库的传统科技巨头	防御性专利失效，护城河失守

这三类主体，过去依靠的恰好是版权、商业秘密、专利这三把旧锁。三把锁同时失灵——这才是范式之问的真正紧迫性所在。

四、有人在探路：几个值得观察的方向

矛盾这么集中、这么多，谁在尝试解决？答案是——没有一个统一的解，但已经有几条不同方向的探路。每一条都不完整，但拼起来能看出一个模糊的轮廓。

方向一｜中国的"数据产权三权分置"

国家数据局推的 "数据资源持有权 + 数据加工使用权 + 数据产品经营权" 三权分置，是全球范围内最早试图给数据建立独立产权框架的尝试之一。

它的思路是：不再硬套版权或专利，而是承认数据是一种新型资产，需要新型产权。

这个方向如果走通，至少能解决"谁有权用这份数据训练模型"和"训练出来的模型里谁有多少份额"这两个基础问题。

但挑战也很大：三权分置在法律层面还停留在政策文件，缺乏司法实践和判例支撑。概念有了，牙齿还没长出来。

方向二｜模型卡 + 数据溯源

技术社区在推的 Model Card（模型卡）和 Data Provenance（数据溯源）机制，试图用技术手段解决一部分 IP 问题：

每个模型附一张"成分表"：用了哪些数据集、什么许可证、训练了多少步；
数据溯源技术（水印、指纹、membership inference）试图回答"这个模型是不是用了我的数据"。

这不是法律方案，但它可能成为未来法律方案的 技术基础设施——就像区块链之于数据确权，不是制度本身，但是制度运行的底层。

方向三｜ "贡献度定价"机制

《贝壳模式启示录》里讨论过 ACN（经纪人合作网络）的分润逻辑——把一笔交易拆成 10 个角色，按贡献度分润。

AI 模型的 IP 分配，或许也需要类似的"贡献度定价"机制：

数据提供方贡献了多少？（Shapley Value 等方法已经在学术界讨论）
算力提供方贡献了多少？
模型架构设计方贡献了多少？
精调和部署方贡献了多少？

这个思路把 IP 从 "非此即彼的归属问题" 转化成了 "多方按比例分润的商业问题"——也许比在法律层面争论"谁是作者"更务实。

方向四｜开源作为一种 IP 策略

一个有意思的现象是：越来越多的 AI 公司选择开源模型权重。

这表面上是在"放弃 IP"，但实际可能是一种更高维的 IP 策略：

开源模型权重 → 锁定生态 → 靠推理服务和企业版赚钱；
开源基础模型 → 让社区帮你做行业微调 → 反哺自己的数据飞轮；
开源 = 让 IP 保护从"排他权"变成"生态位"。

DeepSeek、Meta LLaMA、Mistral 都在走这条路。当知识产权的"排他性"变得越来越难维持，"开放 + 生态 + 服务"可能成为一种替代性的护城河。

五、一个不成熟的猜想：权利束

把上面四个方向拼在一起，我有一个不成熟的猜想：

AI 时代的知识产权，可能不会是一个"统一的新制度"，而是会分化成 一组权利束（bundle of rights）——不同类型的资产用不同的保护机制，靠合同和技术手段串起来。

大概长这样：

资产层	可能的保护机制	成熟度
训练数据	数据产权（三权分置）+ 合同 + 技术溯源	探索中
模型权重	商业秘密（最实际）+ 可能的新型"模型权"	概念阶段
模型架构 / 训练方法	专利（可行但描述困难）+ 论文优先权	部分可用
AI 生成内容	版权（有条件承认，要求人的实质参与）	各国分裂
推理能力	服务协议 + 使用限制 + 生态壁垒	商业实践先行

这不是一把锁，而是 五把不同的锁，锁在不同的抽屉上。它不优雅，但也许比寻找一个"大一统理论"更现实。

回头对照一下第三节那张三视角的表，能看出一个有意思的对应：

巨头视角——主要靠"训练数据 + 模型权重"两把锁；
散户视角——主要靠"AI 生成内容"那把锁（这恰恰是各国分裂最严重的一把）；
策略视角——直接绕过专利那把旧锁，转向"推理能力"的生态壁垒。

旧的三把锁要不要保留？保留，但只够罩住一部分；剩下的部分，得用新锁补。

六、地缘维度：制度本身就是产业竞争工具

地缘维度·三种容器路径：中国建新容器、欧盟给旧容器加锁、美国观望哪个容器赢

权利束的猜想还只是国内视角。镜头拉到国际，会发现一个更关键的事实："用什么锁"这件事本身，就是大国竞争的一部分。

前面第二节提到各国对"AI 能否做发明人/作者"的态度分化——美国拒绝、欧洲拒绝、中国有条件接受、英国早期立法允许。这通常被解读为"法律理念差异"，但如果再想一层，它本质上是产业保护主义的变体。

逻辑很简单：

率先承认 AI 生成物可以拥有 IP 的法域，等于给 AI 企业发了一张"资产化通行证"——模型的产出可以确权、可以交易、可以作为资产负债表上的无形资产。这对吸引 AI 公司注册、落地、融资来说，效果堪比税收优惠。
拒绝承认 的法域，等于说"AI 产出不是财产"——这保护了传统创作者的利益，但也可能把 AI 产业的资产化逼到别的司法管辖区去做。

更深一层：数据产权制度本身也在变成地缘竞争工具。

中国推数据三权分置，意图很明确——让数据要素在国内 可确权、可定价、可流通，把数据从"沉睡的原料"变成"流动的资产"；
欧盟推 Data Act + AI Act，核心是 设置门槛——你的模型要在欧洲跑，你的训练数据必须合规，你的 AI 输出必须可追溯；
美国目前联邦层面 有意留白——没有统一的数据产权法，也没有统一的 AI IP 法，靠判例法逐案推进，给产业最大灵活度。

三种路径、三种"容器"：中国在建新容器，欧盟在给旧容器加锁，美国在观望哪个容器跑得赢。

最终的结果可能是：全球不会有一套统一的 AI 知识产权制度，而是形成几个"容器集团"——就像今天的数据跨境流动已经分化成"美国圈""欧盟圈""中国圈"一样，AI 时代的 IP 制度也会沿着地缘线裂开。

对中国的工业重构来说，这既是风险也是窗口：如果中国能率先跑通"数据产权 + 模型产权 + AI 生成物产权"的完整制度链，这本身就是一种产业基础设施——吸引全球 AI 企业来这里做资产化，就像当年开曼群岛靠公司法吸引全球企业注册一样。

当然，这只是一种可能性。制度竞争的结果从来不取决于谁的设计更精巧，而取决于 谁的市场足够大、让制度跑出了真正的判例和实践。

七、回到工业基座：少了哪一层？

地缘的镜头收回来，再回到我们最初的问题——这一切对中国工业的"二次重构"意味着什么？

回头看《工业克苏鲁》里的四层重构框架——工具层、知识层、组织层、商业层——我越来越觉得，它可能缺了一个底座：

制度层：知识产权的二次重构。

如果知识的容器从"软件代码"变成了"数据 + 模型"，但 IP 框架还停留在保护"代码"和"方法"的阶段，那 知识层的重构就会被卡住——因为没有人愿意把 30 年的核心工艺数据拿出来喂模型，如果分不清楚这个模型里自己的知识值多少钱、归谁。

换句话说：数据不敢流动，模型就训不好；模型训不好，工具层和知识层的重构就跑不动；跑不动，克苏鲁就长不上去。

制度层或许才是四层重构下面那块 看不见但最先会塌的地基。

八、写在最后

这篇没有结论，因为我确实没有答案。全世界都还在摸着石头过河——中国的数据产权三权分置在试，欧盟的 AI Act 在试，美国的版权局在一个案子一个案子地试。

唯一比较确定的一件事是：旧框架不够用了。

当知识溶进了权重，当发明人可能不是人，当数据像盐一样融入了汤里——我们需要的也许不是更精致的旧锁，而是承认：容器变了，锁也该换了。

至于换成什么样——这大概是未来十年，技术界、法律界、产业界需要一起回答的问题。

本文为探索性思考，不构成任何法律建议。涉及各国司法态度的描述基于公开判例和官方文件（美国 Thaler v. Vidal / USCO AI 政策声明、欧洲 EPO DABUS 案、北京互联网法院 AI 生成图片案、英国 CDPA 1988），具体以最新司法实践为准。欢迎讨论。

当知识溶进权重：AI 时代知识产权的范式之问 ​

一、旧框架：三把锁够用了吗？ ​

二、三次漂移：价值不再住在代码里 ​

漂移一 ｜ 从"代码"到"数据" ​

漂移二 ｜ 从"人的创作"到"人机共创" ​

漂移三 ｜ 从"静态资产"到"动态能力" ​

三、矛盾在哪里爆发？三个视角 ​

视角一 ｜ 巨头视角：知识层的悖论 ​

视角二 ｜ 散户视角："智力佃农"问题 ​

视角三 ｜ 策略视角：防御性专利库的终结？ ​

三视角合一 ​

四、有人在探路：几个值得观察的方向 ​

方向一 ｜ 中国的"数据产权三权分置" ​

方向二 ｜ 模型卡 + 数据溯源 ​

方向三 ｜ "贡献度定价"机制 ​

方向四 ｜ 开源作为一种 IP 策略 ​

五、一个不成熟的猜想：权利束 ​

六、地缘维度：制度本身就是产业竞争工具 ​

七、回到工业基座：少了哪一层？ ​

八、写在最后 ​

当知识溶进权重：AI 时代知识产权的范式之问

一、旧框架：三把锁够用了吗？

二、三次漂移：价值不再住在代码里

漂移一｜从"代码"到"数据"

漂移二｜从"人的创作"到"人机共创"

漂移三｜从"静态资产"到"动态能力"

三、矛盾在哪里爆发？三个视角

视角一｜巨头视角：知识层的悖论

视角二｜散户视角："智力佃农"问题

视角三｜策略视角：防御性专利库的终结？

三视角合一

四、有人在探路：几个值得观察的方向

方向一｜中国的"数据产权三权分置"

方向二｜模型卡 + 数据溯源

方向三｜ "贡献度定价"机制

方向四｜开源作为一种 IP 策略

五、一个不成熟的猜想：权利束

六、地缘维度：制度本身就是产业竞争工具

七、回到工业基座：少了哪一层？

八、写在最后