贝壳模式启示录:数据交易需要自己的 ACN

产业洞察 · 数据要素 × 平台经济 | 2026 年 5 月 | 面向数据交易从业者、平台架构师与政策制定者
摘要
2020 年 8 月,贝壳找房以 "中国居住服务平台第一股" 登陆纽交所。支撑其 3000 亿 GTV 的核心引擎不是房子,而是一套名为 ACN(Agent Cooperate Network,经纪人合作网络) 的协作规则——它把一笔交易拆成 10 个角色,让 52 万经纪人跨品牌、跨门店分润,80% 以上的成交都经由这张网络完成。
中国数据要素市场正处于类似的早期阶段:2024 年全国数据交易规模虽已超 1600 亿元,但场内交易占比不足 20%,大量数据 "有场无市"。定价难、确权难、信任难——这三座大山,恰好是贝壳在房产行业用 18 年时间逐一搬走的。
本文系统拆解贝壳 ACN 的底层逻辑,映射到数据要素流通场景,探讨 "数据 ACN" 的设计可能——一种让数据源、加工方、撮合方、应用方各司其职、按贡献分润的协作网络。
一、贝壳 ACN:一笔交易拆出十个角色
要理解贝壳的创新,需要先看清传统房产中介的痛点。
1.1 旧世界:零和博弈
传统中介模式下,一套房子从挂牌到成交,所有环节由单一经纪人独占。这导致:
- 虚假房源泛滥:经纪人用假房源 "钓" 客户到店
- 恶性抢客:谁先带看谁吃独食,无人愿意共享信息
- 服务品质低下:没有分工,没有专业化
左晖在 2018 年推出贝壳时说过一句关键的话:"链家是一个集成式的系统,但行业是分散的,贝壳要把它重新集成起来。" 集成的方式不是垄断,而是建立协作规则。

1.2 ACN 的十大角色
ACN 将一笔房产交易拆解为 房源侧 5 个角色 + 客源侧 5 个角色:
| 侧 | 角色 | 核心职责 | 典型分润占比 |
|---|---|---|---|
| 房源方 | 房源录入人 | 第一个录入真实房源 | ~5% |
| 房源方 | 房源实勘人 | 拍照、VR 录制 | ~3% |
| 房源方 | 房源维护人 | 带看钥匙、小区信息维护 | ~5% |
| 房源方 | 委托备件人 | 处理委托书等法律文件 | ~2% |
| 房源方 | 房源钥匙人 | 保管钥匙、维系业主关系 | ~5% |
| 客源方 | 客源推荐人 | 第一个接触到购房客户 | ~10% |
| 客源方 | 客源首看人 | 第一次带客看这套房 | ~5% |
| 客源方 | 客源成交人 | 推动签约成交 | ~25% |
| 客源方 | 客源合作人 | 辅助带看、新人培养 | ~5% |
| 平台 | 交易/金融顾问 | 合同、贷款、过户 | ~5% |
注:具体比例因城市而异("一市一策"),由各城市 ACN 协会微调。平台本身还会收取约 20-30% 的基础服务费。
1.3 核心设计原则
ACN 成功的背后是三个制度设计:
1. 贡献可记录 —— 每个动作(录入、实勘、带看、签约)都在系统中留下时间戳和责任人,不可篡改。
2. 规则确定性 —— 分润比例公开透明,经纪人在做每一个动作之前就知道自己能获得多少回报。
3. 博弈结构改变 —— 从 "单次零和博弈"(我吃了你就没了)变为 "重复正和博弈"(我分享房源,你带来客户,大家一起赚)。
1.4 楼盘字典:信任基础设施
ACN 能运转的前提是 "真房源"。贝壳从 2008 年开始建设 楼盘字典——用 GPS 定位 + 433 个字段定义每一套房子,覆盖 332 个城市、2.33 亿套住宅、448 万栋楼。每天被调用超过 13 亿次。
这套基础设施解决了一个根本问题:交易对象必须先被数字化、标准化、可验证,协作才有可能。
二、数据交易的结构性困境
数据要素市场面临的挑战,与贝壳创立前的房产中介行业惊人地相似。
2.1 "有场无市"
截至 2026 年初,全国已设立超过 50 家数据交易所/中心。然而:
| 指标 | 数据 | 来源 |
|---|---|---|
| 全国数据交易总规模(2024) | 超 1600 亿元 | 国家数据局 |
| 场内交易占比 | 不足 20%(~300 亿元) | 中国政府网 |
| 北京国际大数据交易所累计备案 | 近 100 亿元 | 北京经信局(2024 底) |
| 深圳数据交易所累计交易 | 突破 150 亿元 | 深圳数交所 |
| 贵阳大数据交易所累计交易 | 超 50 亿元 | 贵阳数交所 |
场内交易所扮演的更多是 "登记备案" 角色,真正的交易仍发生在场外——企业之间点对点谈判、定制化交付。
2.2 三重困境
| 困境 | 表现 | 房产行业的类比 |
|---|---|---|
| 定价难 | 数据没有 "标准品",同一数据集对不同买家价值差异巨大 | "一房一价"——每套房都不同 |
| 确权难 | 数据从谁来、谁加工、谁清洗,贡献链条模糊 | 房源归谁——谁录入、谁维护、谁有钥匙 |
| 信任难 | 买家无法在交易前充分评估数据质量 | 虚假房源——看的图和实际不一样 |
2.3 与房产的关键差异
但数据与房产有一个本质区别,这个区别不是障碍,而是机会:

| 维度 | 房产 | 数据 |
|---|---|---|
| 竞争性 | 强竞争——一房只能卖给一人 | 非竞争——一份数据可卖给多方 |
| 边际成本 | 高——每笔交易需要带看、签约、过户 | 极低——复制传输成本趋近于零 |
| 时效性 | 弱——房子十年后还在 | 强——很多数据隔天就贬值 |
| 价值确定性 | 较高——可参照同小区历史成交 | 低——使用前无法确知价值 |
其中 "非竞争性" 是最关键的差异——同一份数据可以反复出售,参与协作的每一方都在 做大饼 而非 分饼。这一点反而让 ACN 式协作在数据场景中比在房产场景中更容易跑通(详见第五章洞见 2)。
三、从贝壳到数据:ACN 映射框架
如果为数据交易设计一套 ACN,应该长什么样?

3.1 角色映射
| 贝壳 ACN 角色 | 数据 ACN 对应角色 | 核心贡献 |
|---|---|---|
| 房源录入人 | 数据源登记方 | 第一个将原始数据资产注册上链/入库 |
| 房源实勘人 | 数据质检方 | 验证数据真实性、完整性、合规性 |
| 房源维护人 | 数据加工方 | 清洗、脱敏、标注、结构化处理 |
| 委托备件人 | 数据确权方 | 处理授权协议、隐私合规、权属登记 |
| 房源钥匙人 | 数据托管方 | 安全存储、访问控制、密钥管理 |
| 客源推荐人 | 需求发现方 | 找到潜在数据买家、识别应用场景 |
| 客源首看人 | 数据预览方 | 提供样本、沙箱环境,让买家试用 |
| 客源成交人 | 撮合成交方 | 促成定价谈判、完成交易签约 |
| 客源合作人 | 场景适配方 | 帮助买家将数据接入业务系统 |
| 平台顾问 | 结算审计方 | 计量验证、分润执行、争议仲裁 |
3.2 分润规则设计
借鉴贝壳 "费率确定、价格浮动" 的核心原则:
┌─────────────────────────────────────────────────┐
│ 数据交易 ACN 分润框架 │
├─────────────────────────────────────────────────┤
│ │
│ 数据成交价 = 买卖双方协商(浮动) │
│ 分润费率 = 平台规则(确定) │
│ │
│ 供给侧分润(~45%) │
│ ├── 数据源登记方 10-15% │
│ ├── 数据质检方 5-8% │
│ ├── 数据加工方 10-15% │
│ ├── 数据确权方 3-5% │
│ └── 数据托管方 5-7% │
│ │
│ 需求侧分润(~30%) │
│ ├── 需求发现方 8-10% │
│ ├── 数据预览方 3-5% │
│ ├── 撮合成交方 12-15% │
│ └── 场景适配方 5-8% │
│ │
│ 平台基础设施(~25%) │
│ ├── 结算审计 5% │
│ ├── 基础设施运营 10% │
│ └── 生态发展基金 10% │
│ │
└─────────────────────────────────────────────────┘3.3 非竞争性带来的新机制
由于数据可以多次出售,ACN 还需要引入房产交易中不存在的定价机制:
| 机制 | 逻辑 | 类比 |
|---|---|---|
| 独占溢价 | 买家要求排他使用,价格上浮 200-500% | 音乐独家版权 vs 非独家 |
| 共享折扣 | 非独占使用,单价低但供方总收入可能更高 | Spotify 流媒体分账 |
| 时间窗口 | 首发期内独占,窗口期后开放共享 | 电影院线 → 流媒体的窗口期 |
| 用量计费 | 按调用次数/数据量阶梯计价 | API 按量计费 |
| TNPL(先用后付) | 先使用、后根据模型收益分成 | Codatta 的 Train-Now-Pay-Later |
四、谁在实践:三个案例
从全球范围看,已有多个项目在探索 "数据协作网络" 的不同侧面。
4.1 Codatta:链上数据版税引擎
背景:Codatta 是目前最接近 "数据 ACN" 理念的 Web3 项目,构建了一套完整的贡献-验证-分润闭环。
| 维度 | 实现 |
|---|---|
| 贡献记录 | Contribution Fingerprint(CF)——每条数据原子贡献上链签名 |
| 角色划分 | Contributor(贡献者)、Validator(验证者)、Backer(质押者)、Protocol(平台) |
| 分润机制 | Royalty Engine——按使用量 × 质量权重 × 所有权份额计算微支付 |
| 商业模式 | TNPL(Train-Now-Pay-Later)——开发者先用数据训练,模型盈利后再分成 |
| 质量控制 | 随机抽查 + 对抗审计 + 质押惩罚(Slashing) |
核心启发:Codatta 证明了 "用量驱动的持续分润" 在技术上是可行的——类似音乐流媒体每播放一次就给词曲作者分一次账。
概念分润示例:1000 次 API 调用 × $0.002/次 = $2.00 毛收入 → Protocol 15% + 开发者 10% + 知识贡献者 60% + 消费者边际 15%
4.2 国家数据局"三类机构"体系
背景:2026 年 2 月,国家数据局等四部门发布《关于培育数据流通服务机构 加快推进数据要素市场化价值化的意见》,首次体系化定义了数据流通的角色分工。
| 机构类型 | 定位 | 对应贝壳概念 |
|---|---|---|
| 数据交易所(中心) | 规则制定、生态培育、价格发现 | 贝壳平台本身 |
| 数据流通服务平台企业 | 围绕产业链/供应链的专业化服务 | 加盟品牌(如德佑) |
| 数据商 | 贴近需求的产品开发与场景落地 | 一线经纪人/门店 |
核心启发:政策已经给出了 "所-商-平台" 的三层架构,但尚未定义每个角色在同一笔交易中的 具体分润规则。这正是 ACN 应该填补的制度空白。
4.3 Snowflake Marketplace 与 AWS Data Exchange
背景:全球两大云平台的数据市场已建立了成熟的多方结算体系。
| 平台 | 模式 | 分润规则 |
|---|---|---|
| Snowflake Marketplace | 提供商定价 + 平台按量结算 | 平台收取佣金,提供商获得使用分析报告 |
| AWS Data Exchange | 订阅制/按样本计费 | 月度结算,扣除 AWS Marketplace 服务费后打款 |
核心启发:成熟的数据市场平台已实现 "技术层面的自动结算",但角色拆分粒度不够——仍是简单的 "提供商 vs 平台" 双边模型,缺乏对数据生产链条中多方贡献者的精细分润。
五、三条核心洞见
洞见 1:确定性规则比精确定价更重要
贝壳没有解决 "房子该卖多少钱" 的问题——这永远是买卖双方的事。它解决的是 "不管最终成交价是多少,每个角色拿走多少比例是确定的"。数据交易的顶层设计应该聚焦在 分润规则的确定性 上,而不是纠结于 "一条数据值多少钱"。
洞见 2:非竞争性让 ACN 在数据领域比在房产领域更容易跑通
ACN 在房产领域的最大阻力,是经纪人"独吞佣金"的天性——因为一套房只能卖一次。数据则可以反复出售,每一方都能通过 扩大出售次数 增加收入,而非争抢单次份额。这意味着:贝壳花了 18 年靠制度和文化才驯服的"零和心智",在数据 ACN 中本就不是阻力。
洞见 3:楼盘字典 = 数据目录 + 质量认证
贝壳花了 18 年建楼盘字典。数据交易同样需要一套 标准化的数据资产描述体系(元数据目录)和 可验证的质量认证机制(类似 "真房源" 标签)。2026 年国家数据局推动的数据资源登记制度正是这个方向。
六、落地的六道关卡
从 "类比" 走向 "落地",数据 ACN 需要解决六道贝壳不曾面对(或程度更甚)的关卡。其中第一道——防跳单——是决定整个体系能否成立的命门。
6.1 防跳单:最核心的制度挑战
"跳单" 是平台经济的天敌——买卖双方通过平台认识后绕开平台私下成交、逃避佣金。在数据交易中这个问题比房产严峻得多:数据一旦预览或交付就可能被复制,数字传输零摩擦,场外交易也不违法。
贝壳怎么防跳单: 独家委托协议、不可替代的服务嵌入(贷款/过户/资金托管)、信用分惩罚、交易复杂性本身。
数据 ACN 的四层防跳单设计:
| 层次 | 机制 | 原理 |
|---|---|---|
| 技术层 | 数据水印 + 指纹追踪 | 每份数据嵌入接收方唯一标识,泄露可溯源 |
| 技术层 | 隐私计算 / 沙箱环境 | 数据"可用不可见"——买家在平台内使用,拿不走原始数据 |
| 技术层 | 渐进式披露 | 平台只展示元数据和样本,全量数据通过加密通道按需交付 |
| 激励层 | 信用积分体系 | 高信用方获得更低费率、更好数据、优先推荐——跳单即清零 |
| 激励层 | 持续分润 > 一锤子买卖 | TNPL 模式下,数据方的长期收益远超一次场外交易 |
| 合约层 | 非规避条款 + 链上存证 | 通过平台触达的需求方,约定期限内交易必须在平台完成 |
| 结构层 | 让合规交易本身变复杂 | 平台处理确权、脱敏、合规审查、计量——离开平台这些成本自己扛 |
核心原则:靠服务不靠惩罚。 最强的防跳单护城河来自四重价值:合规背书(场外交易无合规证明)、持续更新(动态数据无法一次买断)、质量担保(平台质检 vs 场外货不对板)、网络效应(一个供方对接 N 个买家的长期收益 >> 一次性场外成交)。
6.2 隐私与合规
数据不像房子可以随便看——涉及个人信息的数据不能 "带看"。
可能方案:沙箱预览(受控环境内评估样本)、隐私计算(数据不出域、结果可流通)、在 ACN 中独立设置合规审计角色(类比贝壳的"委托备件人")。
6.3 贡献度量化
房产中"谁录入、谁带看"是离散事件;数据流通中"谁的清洗让数据增值了多少"则是连续且模糊的问题。
可能方案:A/B 测试式增值验证(加工前后送入同一下游模型,对比效果差异)、Codatta 式的质量加权边际贡献(Q-MIA)机制。
6.4 价值稀释管理
数据卖给越多人,每个买家的差异化优势就越小。可用三种机制动态平衡:衰减曲线(每新增一个买家,后续单价下浮 X%,反映独占性递减)、席位溢价(若限定总买家数 N,越往后席位越稀缺、价格反向递增)、分层授权(独占 / 共享 / 开放三档差价明确)。
6.5 时效性退化
很多数据的价值半衰期极短。可用 时间衰减系数(数据越新,"源登记方"占比越高;越旧,"加工方"占比越高)和 有效期合约(超期自动降为开放数据)来匹配。
6.6 冷启动
贝壳的冷启动靠链家 18 年积累的楼盘字典和品牌信用。数据 ACN 可以走:从 公共数据 入手(权属天然清晰)→ 在 垂直领域 跑通小循环(气象、交通等)→ 平台初期 补贴供给侧角色(类比贝壳早期的流量扶持)。
七、未来展望:从登记到协作
数据 ACN 不会一步到位。把贝壳过去 18 年走过的路压缩成一张路线图,可以看到数据交易接下来五年的演进方向。

| 阶段 | 特征 | 对应贝壳历程 | 数据交易现状 |
|---|---|---|---|
| L1:登记 | 数据上架、元数据标准化 | 楼盘字典 1.0(手工录入) | 大部分交易所处于此阶段 |
| L2:协作 | 多方参与同一笔交易、角色分工明确 | ACN 雏形(链家内部) | 少数先行者在探索 |
| L3:自动化 | 分润自动结算、质量自动评估 | ACN 系统化 + 平台扩张 | Codatta/Snowflake 部分实现 |
| L4:生态 | 跨平台互通、行业标准形成 | 贝壳平台开放(德佑加盟) | 尚未出现 |
| L5:智能 | AI 驱动的动态定价和匹配 | 贝壳 AI 估价、VR 看房 | 远期愿景 |
在这条主线之上,可以预见四个相互交织的趋势。
趋势 1:AI 大模型加速 "TNPL" 模式落地
大模型对训练数据的需求创造了前所未有的数据消费场景。"先用数据训练,模型盈利后再分成" 的模式将成为高质量数据集的主流变现方式。这正是数据交易中 "客源成交人" 最有价值的角色——帮数据找到最能创造价值的 AI 场景。
趋势 2:"所商分离" 走向 "所-商-网" 三层结构

国家数据局已明确 "统筹优化布局,严控数量" 数据交易所。未来的格局可能是:少数头部交易所(规则层)+ 大量数据商(服务层)+ 一张 ACN 式的协作网络(协调层)。交易所不再试图自己做撮合,而是制定规则、确认权属、提供仲裁。
趋势 3:垂直领域率先跑通
正如贝壳从二手房切入再扩展到新房、租赁、装修,数据 ACN 也会从 标准化程度高、参与方明确 的垂直领域首先落地——气象数据、金融风控数据、医疗影像数据是最可能的突破口。
趋势 4:从 "数据交易" 到 "数据协作"
最终的演进方向不是 "把数据卖出去",而是 "让多方围绕数据创造价值、按贡献分润"。这与贝壳的终极定位完全一致——贝壳不是一个 "房产交易所",而是一个 "居住服务操作系统"。数据要素市场的未来,也不是更多的 "交易所",而是一个人人都能参与、贡献可量化、回报确定性高的 数据协作操作系统。
结语
左晖曾说,行业最大的问题不是谁能力强,而是 能力强的人没有办法赢。
这句话放在今天的数据交易领域同样成立:好数据找不到好买家,好的加工能力没有稳定回报,好的场景应用者拿不到优质数据——不是能力不够,而是缺少一套让所有角色都能 确定性获益 的协作规则。
贝壳用 18 年证明了一件事:在一个"没有标准价格、每件商品都不同、信息严重不对称"的市场里,制度设计比技术创新更重要。ACN 的本质不是一套软件系统,而是一种让分散参与者愿意协作的 制度安排。
数据交易需要自己的 ACN。谁来建?怎么建?这或许是 2026 年数据要素行业最值得回答的问题。
参考资料
- 善财猫·科创政策,《贝壳 ACN 系统角色分工整理》,http://www.kkddcc.com/post/bei-ke-ACN-mo-shi.html
- 百度百科,《ACN 合作网络》,https://baike.baidu.com/item/ACN合作网络/22710064
- 星辰漫步,《一篇文章讲透贝壳创新战略"ACN"模式》,2022.03,https://www.mworkspace.cn/2022/03/28/yi-pian-wen-zhang-jiang-tou-bei-ke-chuang-xin-zhan-lue-acn-mo-shi/
- 人民网,《楼盘字典十年过亿,贝壳找房破局真房源难题》,2018.05,http://house.people.com.cn/n1/2018/0524/c164220-30009662.html
- 贝壳找房,《贝壳找房陈亭:2.12 亿套真房源大数据》,2020.01,http://news.ikanchai.com/2020/0110/331739.shtml
- KE Holdings,《2025 Fiscal Year Financial Results》,2026.03,https://investors.ke.com/
- 国家数据局等,《关于培育数据流通服务机构 加快推进数据要素市场化价值化的意见》,2026.02,https://www.nda.gov.cn/sjj/zwgk/zcfb/0205/20260205185635251370340_pc.html
- 国家数据局,《专家解读:明确新定位 释放新动能 开创数据商发展新篇章》,2026.02,https://www.nda.gov.cn/sjj/zwgk/zjjd/0212/20260212133359194820190_pc.html
- 中国政府网,《2024 年全国数据市场交易规模预计超 1600 亿元》,2025.01,https://www.gov.cn/lianbo/bumen/202501/content_6997834.htm
- Codatta,《Royalty Economy》,2025,https://docs.codatta.io/en/quick-guide/royalty-economy
- Codatta,《Royalty Engine》,2025,https://docs.codatta.io/en/core-systems/royalty-engine
- 界面新闻,《从链家到贝壳:左晖的"平台化大冒险"》,2018.06,https://www.jiemian.com/article/2238545.html
- 界面新闻,《左晖扔下"炸弹":做贝壳的 500 多天里,他究竟在想什么?》,2019.10,https://www.jiemian.com/article/3627336.html
- arXiv,《Revenue-Sharing as Infrastructure: A Distributed Business Model for Generative AI Platforms》,2026.03,https://arxiv.org/abs/2603.20533v1
- 金证资产评估,《深度解析:公共数据价值评估与定价机制的核心逻辑与实践路径》,2025,https://www.jzvaluation.com/archives/3981