Skip to content

全部文章 共 135 篇

Agent 查数的准确率悬崖:语义层 vs Text-to-SQL

Agent 查数的准确率悬崖:语义层 vs Text-to-SQL

2023 到 2026,大模型写 SQL 的能力翻了一倍(dbt 实测 32.7%→64.5%)。但在真实企业库上,同一批模型从 86% 跌到 10%——这就是‘准确率悬崖’。本文用 dbt、Spider 2.0、BEAVER、Snowflake、Atlan 五组一手基准,拆清楚 Agent 查数到底卡在哪:不是模型不够聪明,而是决定答案对错的语义、口径、权限,根本不在数据库的 schema 里。结论是行业已经收敛的同一个答案——把缺失的上下文做成基础设施(语义层),让查询在编译期被治理,而不是事后补救。

模型越来越便宜,AI 创业反而更难:一道绕不开的推理经济学题

模型越来越便宜,AI 创业反而更难:一道绕不开的推理经济学题

token 单价从 2023 年至今跌了 90% 以上,可企业的 AI 账单不降反增、还在翻倍。这不是临时的 bug,而是结构性的:很多人还指望‘等推理再便宜点毛利就好了’,方向恰恰错了。本文拆解这道绕不开的推理经济学题——为什么 agentic 把 token 当柴烧(Stanford:单个 agent 任务比普通对话多烧 1000 倍 token)、为什么创业公司在交一笔躲不掉的‘token tax’(用零售价的智能、对手用成本价)、AI 原生产品毛利为何被锁在 SaaS 之下 30 个点,以及两条逃生路(自研推理、按结果计费)各自的代价。

当 agent 自己查数据:旧治理假设失效,新栈长什么样

当 agent 自己查数据:旧治理假设失效,新栈长什么样

过去二十年,企业数据治理建立在一个朴素假设上:是人来查数据——提个工单、等审批、在自己权限内看报表。AI agent 把这个假设掀翻了:它持续、以机器速度、探索式地发起成百上千次查询,不排队、不等审批。这意味着工单式权限、静态角色、事后审计这套老办法在 agent 面前会成批失守。本文从公开基准(Spider 2.0、BEAVER)讲清楚危险不止是泄露、更是‘自信的错答’,再用一个厂商中立的七层治理模型,把‘从自然语言到一行数据’这条路重做一遍:身份、语义层、策略编译、查询校验、受控执行、响应防护、审计可回放,并诚实地划出它与跨组织数据流通之间的边界。

工业数据“采、集、用”瓶颈:政策解码,难在‘用’

工业数据“采、集、用”瓶颈:政策解码,难在‘用’

工信部启动‘工业数据筑基行动’,公布先行先试联合体名单,把工业数据的难题精准切成‘采、集、用’三段。这篇政策解码不平均用力——采和集是入场券,‘用’才是终局,也是最容易被低估的一环。本文先讲清三段瓶颈与‘1+4+N’政策框架,再重点拆解‘用不好、用不深、用不久’的三层病灶:数据集质量配不上工业 AI、应用场景浅层化、生态与安全滞后,并把工业数据从静态资源走向动态生产力的路径拆成一个可落地的应用阶梯。

数据不动,指针先行:Komprise TFT 与非结构化数据的“零搬迁”范式

数据不动,指针先行:Komprise TFT 与非结构化数据的“零搬迁”范式

企业 80% 以上的数据是非结构化的,却有约 99% 对 AI 是“暗”的——不是因为没价值,而是因为没 schema、质量差、搬不动。6 月 23 日 Komprise 发布的 Transparent File Tables 给了一个反直觉的解法:不搬一个文件,先把全局元数据和指针做成一张 Apache Iceberg 表丢进湖仓,让 Snowflake/Databricks 直接查;真要原始文件时才按需搬运。本文拆解它的原理、与“全量 ETL 拷贝”和“湖仓外部表”的差别,以及它背后那条正在成形的大趋势:把 AI 带到数据身边,而不是把数据搬到 AI 身边。

协调成本两百年:从科斯天平到 AI 触发的下一次组织重构

协调成本两百年:从科斯天平到 AI 触发的下一次组织重构

有研究预测,到 2026 年底约两成组织将精简掉一半以上的中层管理岗,且“协调层最先被压缩”。这不是孤立事件——从蒸汽机把人聚集到工厂,到互联网把组织拆成全球网络,人类组织两百多年的演化其实是同一个故事:协调成本不断下降。本文给出一个贯穿始终的框架——两个问题(集中度、边界)加一架天平(内部协调成本 vs 市场交易成本)——再沿时间轴逐段讲清工厂制、科层制、事业部制、精益网络、平台、敏捷直到智能体组织是怎么一步步变过来的,最后拆解 AI 这一次为什么不同,以及它会把组织推向什么形状。

给智能体设计一套支付体系:哪些能从区块链支付里借鉴,哪些不能

给智能体设计一套支付体系:哪些能从区块链支付里借鉴,哪些不能

信通院把“智能体支付协议”列进 2026 十大关键词,让我想到一个问题:比特币、以太坊那套支付思路——挖矿、钱包、链上结算——能不能搬来给智能体用?深挖之后发现一个有意思的事实:x402、AP2、MPP、L402 这些已经跑起来的智能体支付协议,确实在大量借鉴区块链,但它们借的是稳定币、私钥签名、链上结算和 L2 微支付,而恰恰把“挖矿”和原生币波动这两样扔掉了。本文拆解哪些零件能装、哪些不能,并顺着“挖矿”这个念头推演一种 agent 自己赚钱又花钱的闭环机器经济。

AI 编程孤独症:当工程师只剩下自己和 agent

AI 编程孤独症:当工程师只剩下自己和 agent

Anthropic 工程负责人 Fiona Fung 在 Lenny 播客上说了一句反直觉的话:当团队人均代码产出涨到八倍、编程不再是瓶颈时,工程师反而变得越来越孤独。本文从这场访谈出发,拆解 AI 编程把工程师变成 agent 调度员之后,正在悄悄流失的隐性知识与协作,并整理出 Anthropic 用工程化手段重建协作的具体打法。

从“可用”到“可信”:信通院 2026 智能体十大关键词里藏着的产业拐点

从“可用”到“可信”:信通院 2026 智能体十大关键词里藏着的产业拐点

6 月 9 日,中国信通院发布“2026 智能体十大关键词”。十个词看似各说各的,串起来其实是同一条主线:智能体正从“能不能用”转向“能不能规模化、可信任地落地”。本文把十个关键词归到地基、能力、价值、治理四层,逐层讲清它们各自要解决什么问题,以及对技术从业者、落地团队和想做 agent 生意的人分别意味着什么。

破局的纪律:为什么顶尖战略家只死磕“主要矛盾”?

破局的纪律:为什么顶尖战略家只死磕“主要矛盾”?

普通人以为高手能同时解决更多问题,实际上恰恰相反——真正厉害的人,当十个问题同时摆在面前时,只认一个,其余九个先放着。这种能力在《矛盾论》里叫主要矛盾,我更愿意叫它矛盾排序。本文用情绪排序、空间排序、系统排序三个递进层级,加一个数据智能团队的真实困局,拆解顶尖战略家被严重低估的破局纪律,并提炼成可复用的四步法:战略不是选择,而是舍弃。

Demo 惊艳,上线翻车:为什么大多数 Agentic AI 项目死在生产环境

Demo 惊艳,上线翻车:为什么大多数 Agentic AI 项目死在生产环境

一个 agent 在 demo 里行云流水地跨三个系统取数、综合判断、自动跑完一个原本要花一下午的流程,全场点头说'有前途';然后一上生产就悄悄崩了。Gartner 预测到 2027 年底超 40% 的 agentic AI 项目会被取消,MIT 说 95% 的 GenAI 试点失败,行业复盘显示约 88% 的 agent 项目根本到不了生产、单个失败项目平均烧掉 34 万美元。本文用两个真实翻车现场(物流异常处理 agent、B2B 客户成功 copilot)说明:差距不在模型,而在它周围的编排层与治理——状态持久化、幂等、死信、可观测、熔断、人在环、有人负责。再用一张'七种失败模式(按频率)'拆出范围蔓延(34%)+数据质量(27%)合占 61% 的两大杀手,给出一份'能跑 demo'≠'能上生产'的就绪清单,并回到中文语境谈怎么避开。

Databricks Summit 2026 复盘:智能体缺的不是智商,是上下文

Databricks Summit 2026 复盘:智能体缺的不是智商,是上下文

2026 年 6 月 16 日,Databricks 在旧金山 Moscone 开幕 Data + AI Summit,CEO Ali Ghodsi 把全场定调成一句话:AI 不是不够聪明,而是缺上下文(AI doesn't have an intelligence problem, it has a context problem)。本文按 Day-1 Keynote 的实际章节顺序复盘这届 Summit 的两手棋:底层一手是 LTAP(Lake Transactional/Analytical Processing),用 Lakebase 把 OLTP 与 OLAP 收进同一份存储、连根拔掉 ETL 管道;上层一手是 Genie Ontology + Genie One,给智能体补上'活的上下文',让它从'自信地答错'变成基于受治理数据作答。文章拆解 LTAP 和 HTAP / Zero ETL 的本质区别、Lakebase 的工程数字(每天 1200 万次数据库启动)、Genie 全家桶与配套的 Reyden/Lakehouse//RT 实时引擎、Unity AI Gateway、Panther 收购与 CustomerLake,并和两周前的 Snowflake Summit 做殊途同归的对照,最后落到这对数据工程师、企业落地与国内湖仓意味着什么。

GEO 生成引擎优化:AI 搜索时代的流量重构与品牌主权

GEO 生成引擎优化:AI 搜索时代的流量重构与品牌主权

过去三十年,互联网的入口是“蓝色链接”,谁排在 Google 第一页谁就有流量。现在这套规则正在崩塌:越来越多人直接问 AI,拿到的是一段被合成好的答案,而不是一串链接。GEO(生成引擎优化)就是为这个新世界准备的——它要的不是“排第一”,而是“被 AI 引用”。本文讲清 GEO 是什么、从哪来、AI 搜索怎么运作、有哪些硬数据、具体怎么做,以及对中文世界意味着什么。

Loop Engineering 实战:从写 Prompt 到设计循环,附一个可运行的自纠错示例

Loop Engineering 实战:从写 Prompt 到设计循环,附一个可运行的自纠错示例

2026 年 6 月,Peter Steinberger 和 Boris Cherny 先后抛出同一句话:别再给 coding agent 写 prompt 了,去设计那个替你 prompt agent 的循环。Addy Osmani 把它命名为 Loop Engineering(循环工程)——继 Prompt Engineering、Context Engineering 之后的第三层抽象。本文不停在概念层面,而是把一个生产级循环拆成六个可落地的要素(触发器 / 可验证目标 / Generator-Critic 分离 / 共享状态 / 熔断器 / 可观测性),再用约 100 行零依赖 Python 写出一个会自我纠错的代码生成循环:第 1 轮交出有 bug 的代码,拿到测试反馈后第 2 轮自动修正通过。文章还演示如何用 Cursor 的 /loop 给循环装上定时触发器,并给出从 demo 到生产的五个升级方向。核心论点只有一句:杠杆点从'措辞'移到了'系统架构',这让循环设计比写 prompt 更难,而不是更简单。

Agentic 数据工程:钻进数据栈的 Upriver 拿到了钱

Agentic 数据工程:钻进数据栈的 Upriver 拿到了钱

一家成立两年的以色列公司 Upriver 拿了 1400 万美元种子轮,做的是最不性感的活:替企业自动修数据管道。这笔小钱值得说,不是因为金额,而是因为它把一个判断摆上了台面——AI 落地真正的瓶颈不在模型,在数据;而修数据这件事,正从人力密集的脏活,变成一门可以被 agent 接管的生意。本文拆解它的 context engine + reasoning engine 双引擎、为什么“钻进栈里”比“坐在栈上”更难也更值钱、数据工程师的岗位会怎么变,以及国内的对应路径。

我们算的"最优驻地",48 强真照着选了吗?世界杯开赛对账

我们算的"最优驻地",48 强真照着选了吗?世界杯开赛对账

25 天前我们用飞行最优模型给每支球队算了"该驻在哪"。今天世界杯开幕、48 队驻地全部落地,我们把模型点名预测过的 22 支队逐一对账——命中率约 36%、含"部分"约 59%,但真正有意思的是"偏离"的方式:海岸走廊队几乎全中,横跨大陆的强队却不约而同扎堆堪萨斯城。这篇拆解数据,并回答一个更重要的问题:模型"没押中城市",是不是就错了?

一条 issue 评论偷走生产密钥:Claude Code Action 漏洞实录

一条 issue 评论偷走生产密钥:Claude Code Action 漏洞实录

上篇《数据抽水机》讲的是『没人攻击、正常使用也会静默外泄』,这篇是它的主动投毒版:微软威胁情报披露,攻击者只用一条藏在 issue 里的评论,就能让 Claude Code GitHub Action 读出 CI 环境里的生产密钥。本文逐步拆解这条攻击链——为什么 Bash 有沙箱、Read 却没有,提示注入如何同时绕过模型拒答与 GitHub 密钥扫描,以及企业用『双之规则』等四招怎么防。

Agent 级工具沦为"数据抽水机":当数据被静默同步回云端

Agent 级工具沦为"数据抽水机":当数据被静默同步回云端

Claude Code、Cursor、OpenClaw 这类深入开发与生产环境系统底层的 Agent 级工具今年大爆发。本文从三个层面拆解:『数据抽水机』背后的本质是什么、它带来的四类风险有多大、以及企业该如何分层应对——从最便宜的『接管默认值』到最重的『离线沙箱与分级路由』。

AI 创业下一波,不是软件是服务(YC · Charlie Warren)

AI 创业下一波,不是软件是服务(YC · Charlie Warren)

“软件吞噬世界”讲了二十年,但 YC 合伙人 Charlie Warren 在最新分享里给出一个反直觉判断:未来十年最大的一批公司,可能根本不是软件公司,而是被 AI 从零重建的服务型公司——律所、保险、税务、审计、按揭。它们卖的不是 SaaS,而是‘办好的结果’。本文拆解他这套‘AI 原生服务公司’打法:为什么服务业 TAM 是软件的 2–3 倍、‘产品即运营’与方差为何是生存级问题、什么样的市场适合(含 Sam Altman 测试)、如何避开‘早期需求陷阱’、怎么按价值而非成本定价、P&L 里的‘AI 经营杠杆’,以及为什么‘自建几乎总是优于收购’。

智能体控制平面:当"管不住的同事"越来越多,企业需要一个总开关

智能体控制平面:当"管不住的同事"越来越多,企业需要一个总开关

2025 年底 Forrester 把『智能体控制平面(Agent Control Plane)』正式定义为企业智能体架构的第三个平面。当 Cursor、Copilot、ChatGPT 和一堆内部 Agent 比 IT 部门的治理能力跑得还快,企业需要一层横在所有智能体和所有系统之间的『总开关』。本文从这个词的来历讲起,拆解数据平面 vs 控制平面的边界、连接·控制·安全·观测四大职能、它和 MCP / 编排层 / AI 网关的区别、当前的厂商图景,以及挡在落地路上的三道标准缺口。

Snowflake 意图驱动治理:把数据治理从"写策略"变成"说意图"

Snowflake 意图驱动治理:把数据治理从"写策略"变成"说意图"

Snowflake Summit 2026 上 Horizon Catalog 发布的 Intent-Driven Governance(意图驱动治理),让你用自然语言写下『要守住什么』,系统自动编译成掩码、行访问、分类、打标、漂移检测与告警等可执行策略,并生成可追溯回『人类意图』的审计包。本文拆解它的闭环机制、底层的标签化执行原理、与传统 Policy-as-Code 的范式差异,以及合规与落地的现实约束。

Snowflake Summit 2026 开幕 Keynote 精译:欢迎来到"智能体企业"

Snowflake Summit 2026 开幕 Keynote 精译:欢迎来到"智能体企业"

2026 年 6 月 1 日,Snowflake CEO Sridhar Ramaswamy 在 Summit 2026 开幕主题演讲上喊出『欢迎来到智能体企业(The Agentic Enterprise)』。本文按 Keynote 实际章节顺序逐段精译与解读:智能体企业的四支柱、CoWork 与 CoCo 这套『智能体控制平面』、为什么你的数据(而非模型)才是护城河,以及 Accenture、Sanofi、Anthropic 三场对谈的要点,关键处保留英文原引语。

Snowflake Horizon Context:把"业务语义"做成治理层

Snowflake Horizon Context:把"业务语义"做成治理层

Snowflake Summit 2026 上发布的 Horizon Context,把散落各处的元数据变成一个『受治理的业务语义层』,让每个 AI 智能体、BI 工具和应用都基于同一套可信定义回答问题。本文以竞品调研的视角,拆解它的三层能力(Collect / Enrich / Activate)、最关键的『治理在含义层』差异化,并把它和 Unity Catalog、dbt Semantic Layer、AtScale / Cube、Collibra / Alation 逐项对比。

一台机器可以买,一张网买不到:从"不可投资"清单看中国工业护城河

一台机器可以买,一张网买不到:从"不可投资"清单看中国工业护城河

2025 年 9 月,彭博社一篇报道刷屏:八位西方清洁技术 VC 实地走访中国后,得出一份'不可投资的西方资产清单'——电池、光伏、风电硬件、电解槽全被划掉。本文先拆这篇报道真正的反转(领先≠赚钱),再以它为切口,深挖中国工业最核心的一组矛盾:当一个国家可以系统性地用'不追求财务回报'的方式赢下整条产业链,全球资本的'可投资性'标准本身正在被重写。

Snowflake CoWork:当"数据云"改名"工作智能体"

Snowflake CoWork:当"数据云"改名"工作智能体"

在 Snowflake Summit 2026 上,曾经的 Snowflake Intelligence 正式更名为 Snowflake CoWork。一次改名背后,是这家公司从『数据云』向『智能体控制平面』的转身。本文拆解 CoWork 的产品定位、技术架构、本届 Summit 的五项升级、它的治理护城河与竞争格局,并冷静审视尚未解决的风险。

73 天闪电过会:宇树科技冲刺科创板"具身智能第一股"

73 天闪电过会:宇树科技冲刺科创板"具身智能第一股"

2026 年 6 月 1 日,宇树科技科创板 IPO 过会,从受理到上会仅 73 天,刷新科创板最快纪录之一,A 股有望迎来'具身智能第一股'。本文梳理这次过会的全部关键事实:73 天闪电速度背后的'预先审阅'机制、两轮问询函里监管最关心的五个问题(市场地位、业绩可持续性、近 60% 毛利率、技术先进性、募投产能)、'盈利却被追问创新性'的科创属性争议与给后来者的五条镜鉴、17 亿营收与 6 亿扣非净利润的财务画像、王兴兴 33.36% 持股与 420 亿估值,以及这次过会对人形机器人行业意味着什么。

Stay Hungry, Stay Foolish:伟大不是更聪明,而是更饿、更敢傻

Stay Hungry, Stay Foolish:伟大不是更聪明,而是更饿、更敢傻

“Stay hungry, stay foolish”——这句被无数人引用的话,很多人以为是乔布斯原创,其实不是。本文先把出处考据清楚,再回到乔布斯的原话,用‘饥渴(Hungry)× 愚(Foolish)’这两台向前的引擎,去读乔布斯、贝索斯、马斯克和任正非、马云、雷军、张一鸣这七位中外创始人的创业历程。结论不是鸡汤:饥渴负责‘想要得更远’,愚负责‘敢走没人走的路、永远当学徒’;伟大公司背后,是长期的笨功夫与初学者心态,而不是聪明的捷径。

Meta 零停机迁移 PB 级数据摄取系统:影子、反向影子与 CDC 止血术

Meta 零停机迁移 PB 级数据摄取系统:影子、反向影子与 CDC 止血术

Meta 工程团队披露了一次教科书级的系统迁移:把每天从 MySQL 增量抓取数 PB 社交图谱数据的摄取链路,从'各团队自管的分散管道'整体搬到'集中托管的数仓服务',全程零停机、数万作业全量切换、旧系统彻底下线。本文从技术实现角度拆开这次迁移的三大核心机制——①Shadow / Reverse Shadow / Cleanup 三阶段生命周期,用反向影子换来'切换后还能继续比对 + 秒级回滚';②行数 + checksum 双校验 + Scuba 实时回环的数据质量闭环;③针对 CDC'坏数据会自我繁殖'特性的分区级止血与回填策略。最后讲它在数万作业规模下怎么用自动晋级/降级 + 批次规划 + 复用旧快照把成本压下来,并提炼出可迁移到任何团队的 5 条工程经验。

从 219 个单词到 GDSII 版图:Verkor Design Conductor 的全自主芯片设计闭环

从 219 个单词到 GDSII 版图:Verkor Design Conductor 的全自主芯片设计闭环

一份 219 词的需求文档,12 小时后变成一块 RV32I RISC-V CPU 的 GDSII 版图,全程没有人插手。这是 2026 年最像“科幻”的一条 AI 新闻。但把论文一页页读完,你会发现真正值得记住的,既不是“12 小时”,也不是“7nm”——而是这套系统第一次把芯片设计当成一个可以端到端交给 Agent 的完整工程问题。本文厘清它做成了什么、没做成什么,以及为什么它依然重要。

从 RAG 到上下文工程:AI 工程的重心,正从“调模型”转向“策展上下文”

从 RAG 到上下文工程:AI 工程的重心,正从“调模型”转向“策展上下文”

IBM Master Inventor Martin Keen 在一期视频里抛出一个正在成为行业共识的判断:让 AI 做对事的最大瓶颈不是模型本身,而是它在推理那一刻能触达的上下文结构。本文沿着从 Naive RAG → GraphRAG → 上下文工程(Context Engineering)的演进主线,拆解三种检索范式的边界、GraphRAG 的三阶段原理、上下文工程的四大支柱,并用 GraphRAG 72%–83% 偏好率、多智能体隔离上下文提升 >90%、LazyGraphRAG 把索引成本从 3 万美元压到约 30 美元、Rakuten 错误率降 97% 等真实数据,说明为什么 2026 年最值钱的工程能力不再是写更好的 prompt,而是为模型设计它该看见的信息环境。

华为“韬(τ)定律”:绕开摩尔定律,用“时间缩微”重塑芯片规则

华为“韬(τ)定律”:绕开摩尔定律,用“时间缩微”重塑芯片规则

2026 年 5 月 25 日,华为正式提出半导体演进新原则——“韬(τ)定律”,主张以“时间缩微”替代传统的“几何缩微”。通过逻辑折叠等技术,华为在不依赖极端先进制程的情况下,预计到 2031 年实现等效 1.4 纳米的晶体管密度。本文深度解析τ定律的技术内涵、如何直击 AI 推理的“数据搬运”瓶颈,以及它将如何把制程约束转化为中国半导体产业的新定义权。

中国版“一人公司”:为什么 Polsia 的剧本跑不通,以及为什么这反而是好事

中国版“一人公司”:为什么 Polsia 的剧本跑不通,以及为什么这反而是好事

“AI 时代的一人公司图鉴”系列终篇:Polsia 靠叙事融资、名人资本与自指 demo 在硅谷跑通的一轮 A 轮,在国内几乎找不到对称的接盘结构。本文拆解新护城河三件套(分发、信任、品味)在中国的本土化变形,说明为什么“跑不通”反而把大多数人推向 Levels 式真实收入路线——以及国内一人公司更现实的四条打法。

一人公司的“护城河悖论”:当模型是租的、工具是租的,你护城河在哪

一人公司的“护城河悖论”:当模型是租的、工具是租的,你护城河在哪

AI 把一人公司的代码、模型、工具链、基础设施全部变成可租用资源——门槛拍到地板的同时,传统护城河四件套几乎同时失效。本文是“AI 时代的一人公司图鉴”系列第 3 篇:用租用清单拆穿“我做出了产品”的幻觉,解释新护城河三件套(分发、信任、品味)为何让 Levels 长青而 Polsia 悬空,并给出中间层创业者的四条实操原则。

evosoft 谢幕:当工业巨头决定“自己写代码”

evosoft 谢幕:当工业巨头决定“自己写代码”

2026 年 5 月,西门子宣布关闭德国全资软件子公司 evosoft GmbH,377 名员工将在 2027 年底前安置完毕;与此同时,匈牙利 1,700 人的 evosoft Hungary Kft. 仍在运转、正向 AI 加速。本文从一手德媒报道与匈牙利 CEO 专访出发,拆解关停决策的三层逻辑(订单内化 / 长期亏损 / One Tech Company 改革),并把这件事映射到中国工业软件子公司的定位选择上——硬件巨头要真正软件化,最终一定要把代码握在自己手里。

Polsia $250M 估值的另一面:12 个月真实留存 0.04% 的“一人独角兽”

Polsia $250M 估值的另一面:12 个月真实留存 0.04% 的“一人独角兽”

2026 年 5 月,旧金山初创公司 Polsia 以 1 创始人 + 0 员工 + $250M 估值拿到 $30M A 轮,自报 ARR $9.7M、平台上 7,600 家公司在跑——这是 Sam Altman 2023 年那场'一人独角兽'赌局以来最接近预言的样本。但 Hacker News 在融资官宣同周发布的技术审计揭穿了头条数字:93.7% 创建公司已死、月流失 48%、12 个月真实留存 0.04%、AI 层只是 Claude on Bedrock 的封装、代码里还埋着 god-mode kill switch。本文是“AI 时代的一人公司图鉴”系列第 2 篇,把 Polsia 的自报数据与审计数据并列扒开,并解释它为什么仍然能融到 $30M、估到 $250M——以及这件事对中国 AI 创业者意味着什么。

Pieter Levels:从 vibe coding 到不写代码,一人公司的下一站

Pieter Levels:从 vibe coding 到不写代码,一人公司的下一站

荷兰独立开发者 Pieter Levels(@levelsio)在 X 上公开的收入结构、2025 年用 Cursor 三小时搓出的飞行模拟器、以及 2026 年“六个月没写代码”的表态,把“一人公司”从励志故事推成了可拆解的方法论。本文梳理他 2025–2026 的可核查事实,并落到对技术从业者与数据/AI 团队的启示。

Agentic Design Patterns 实战速查:21 个模式与最小可读实现

Agentic Design Patterns 实战速查:21 个模式与最小可读实现

Antonio Gullí 2025 年在 Springer 出版的《Agentic Design Patterns》把 AI Agent 工程总结为 21 个可复用模式。本文按 4 大类(基础模式 / 高级系统 / 生产关注 / 多智能体架构)逐一拆解每一个模式:解决什么问题、怎么实现(一段最小可读的 Python 示例代码)、什么时候用 / 什么时候不用 / 常见陷阱。覆盖 Prompt Chaining、Routing、Parallelization、Reflection、Tool Use、Planning、Multi-Agent、Memory Management、Learning and Adaptation、MCP、Goal Setting、Exception Handling、Human-in-the-Loop、RAG、A2A、Resource-Aware Optimization、Reasoning Techniques、Guardrails、Evaluation、Prioritization、Exploration 全部 21 个模式。文章结尾用一个完整的「现代编程 Agent」配方演示如何把这些模式组合起来。读完即可用作日常 Agent 工程的查阅手册。

冥王星降级的 4 堂管理课:升级规则,而非惩罚个体

冥王星降级的 4 堂管理课:升级规则,而非惩罚个体

2006 年 8 月 24 日,国际天文联合会(IAU)在布拉格通过决议,把冥王星从九大行星里移除——这是一次教科书级的'非人格化变革':不是因为冥王星变小了、犯错了,而是人类发现了阋神星,旧的'九大行星'分类系统已无法承载新的认知。本文把这个科学事件映射到管理学,提炼出 4 堂课:①业务演进必然要求零基重审 ②'清空轨道'是核心业务的真正定义 ③人才错配要靠序列重定位(不是降职)④变革必须基于规则升级(不是针对个人)。重点用三分之一的篇幅讲第 4 课最难落地的部分——IAU 做到非人格化的 3 个机制 + 给管理者的 5 步可操作清单。这是《星环与易华录》《零基思维》《Cloudflare 裁员》三联视角之后的方法论收束篇。

AI 冲着 Measurer 来了:Cloudflare 裁员 20% 的冷启示

AI 冲着 Measurer 来了:Cloudflare 裁员 20% 的冷启示

2026 年 5 月 21 日,Cloudflare CEO Matthew Prince 在《华尔街日报》亲自发表署名文章,解释为什么业绩创纪录的同时还裁员 20%——他借用 Peter Drucker 1954 年的三分法(Builders / Sellers / Measurers),论证 AI 不是冲着所有人来的,而是冲着 measurer(测量者)来的:中层管理、合规、内审、财务、营销分析这一整个'测量'类岗位将被 AI 大规模替代,工程师与销售反而更值钱。这是 ChatGPT 发布以来,第一位用真实裁员数据 + 系统化框架公开背书'AI 裁员'的大公司 CEO。本文冷静解读 Prince 的论点、它在 2026 年突然有杀伤力的原因、三个不容忽视的边界,以及华尔街和 Hacker News 那一边响亮的 'AI-Washing' 质疑——同期 Cloudflare 运营亏损 6200 万美元、毛利率从 75.9% 跌至 71.2%、合规与内审 AI 化的法律风险、疫情扩张期烂账如何被'翻篇'——最后给出中国企业语境下的现实参考和三类人的行动指南。

零基思维:AI 时代的架构决策原则

零基思维:AI 时代的架构决策原则

M4 + Cursor 让端侧 AI-Native 真的可用,越来越多团队开始抛开历史债、围绕流式交互 + Agent 编排重新设计架构——这就是零基思维(Zero-Base Thinking)。本文把它作为一个可被严肃使用的架构方法论系统讲一遍:零基的精确定义(一种作用于决策、可保留代码、可灵活规模的方法论)、AI 吃掉了哪些中间层(4 类消化地图)、零基 vs 打补丁的 2×2 决策矩阵、AI-Native 架构必须满足的 6 个特征、Strangler 渐进落地的真实节奏、三个最常见的失败模式。本文是《传统数据公司怎么活》的架构视角姊妹篇。

星环与易华录的冷启示:前 AI 时代的数据公司怎么活

星环与易华录的冷启示:前 AI 时代的数据公司怎么活

星环科技 5 月 9 日被暂停全军采购资格,*ST 易录 5 月 19 日启动预重整——两家传统数据技术公司同期撞墙。但把它们当作'没摸到 AI 门的失败者'来批判其实是个误读:它们本来就不是 AI 公司,是数据基础软件商、智慧城市集成商。真正值得讨论的不是'怎么转身成 AI-Native',而是这一类'前 AI 时代的数据技术公司'在 AI 时代怎么活下来。本文先把这类公司重新定位,再冷静拆解 AI 给它们带来的边界变化,最后给出 5 种现实生存路径(不是单一的'转身指南')——一份不被 AI 焦虑绑架的产业观察。

FPT Flezi Foundry 发布:当 IT 外包行业第一次把"按结果付费"写进合同

FPT Flezi Foundry 发布:当 IT 外包行业第一次把"按结果付费"写进合同

2026 年 5 月 22 日,越南 IT 巨头 FPT 发布 Flezi Foundry™——业界第一个明确围绕 Service-as-a-Software(代理式服务)与 Outcome-Based Delivery(按成果交付)打包的企业级软件开发 + IT 运维平台。AI Agent 在人类监督下直接承担编码、审计、漏洞修复等最终成果,成熟期目标自动化处理 60%–90% 的一线技术支持。本文从事件本身切入,拆解两大服务模式(ADLC / AMS)、四大平台基座、商业模式革命,并对标 TCS / Infosys / Accenture 同期动作,最后给出落地观察与待解风险。

AI 时代的商业模式:从数据视角出发

AI 时代的商业模式:从数据视角出发

互联网时代卖的是连接,AI 时代卖的是数据驱动的智能。数据即智力——但这里的'数据'是泛数据:数据原料 × 数据工程 × 反馈闭环,三轮齿合才是真正的护城河。本文按读者认知顺序梳理:为什么是数据 → 智力的底层结构 → 谁在哪一层赚钱 → 针对大客户/中小客户/行业客户的差异化打法 → 产业格局推演 → 入局自检清单。

百度胜算:当 Agent 从"聪明的局外人"变成"靠谱的自己人"

百度胜算:当 Agent 从"聪明的局外人"变成"靠谱的自己人"

百度在 Create 2026 上发布企业数据智能平台「百度胜算」,试图破解 Agent 落地企业核心业务的最大瓶颈——准确率。通过上下文工程(三大业务图谱)与系统工程双管齐下,将复杂场景准确率从 80-90% 提升至 99%。本文深度解读这一产品的技术逻辑、行业定位与真实挑战。

Building Your Personal Brand in the Age of AI

Building Your Personal Brand in the Age of AI

五年前我在团队内部讲 Building Your Personal Brand,核心是在企业里让人看见你。五年后,AI 改写了一切——一人公司爆发、企业边界消融、'被雇佣'不再是唯一选项。个人品牌从'企业内的能见度'进化为'AI 时代的生存基础设施'。本文从五年前的那次演讲出发,重新审视这个问题。

七万亿"六张网":把算力修成下一条高速公路

七万亿"六张网":把算力修成下一条高速公路

国家发改委预计2026年'六张网'及重点领域投资超7万亿元。5月18日丁薛祥调研算力网建设,标志着算力网从部门规划正式升格为国家意志。本文深度拆解七万亿的构成、算力网的建设全景、资金来源与去向,以及这张'国家级算力一张网'背后的战略逻辑。

百度 Create 2026:Builder×Founder×Creator 三位一体与"超级个体"时代

百度 Create 2026:Builder×Founder×Creator 三位一体与"超级个体"时代

李彦宏在 Create 2026 大会上宣布 AI 竞争从模型转向智能体,提出 Builder×Founder×Creator 三位一体理念:一个人加上一支智能体编队就是一家公司。首次提出 DAA(日活智能体数)取代 Token 作为 AI 时代度量衡,预测全球 DAA 将超 100 亿。本文深度解读超级个体崛起背后的逻辑、产品布局与行业影响。

决赛之路飞 6,103 还是 21,533 公里?2026 美加墨世界杯赛程的飞行地图

决赛之路飞 6,103 还是 21,533 公里?2026 美加墨世界杯赛程的飞行地图

同样从小组赛打到决赛,最舒服的法国队飞 6,103 公里,最累的波黑队飞 21,533 公里——3.5 倍极差。剔除跨洋抵达和决赛后回家的地理税后,球队真正在赛区内消耗的飞行公里全部由抽签结果、对阵图位置、两阶段驻地选址这三件事决定。我们用 FIFA 实际允许的搬迁规则把每队的最优驻地策略算到底。

高质量数据集的七个明确观点

高质量数据集的七个明确观点

不再罗列维度,给出七个旗帜鲜明的判断:不存在普世的高质量、质量必须包含多样性、数据集是能力不是项目、规范定义决定 90% 的成败、警惕合成数据反噬、Data Card 是工程纪律、'高质量'已是国家战略但警惕政策打卡式建设。写给只想听真话的从业者。

数据工程实战:高质量数据集系统化指南

数据工程实战:高质量数据集系统化指南

什么叫高质量数据集?怎么系统化建设?本文一次讲清——多维度评判标准、不同任务下的画像差异、中国《高质量数据集建设指引》的官方定义与三高标准、七步闭环建设流程、工具链全景与十条踩坑经验,写给数据工程师与 AI 团队。

数据即智力:数字化下半场的内核重写

数据即智力:数字化下半场的内核重写

数据曾经是死的——它是业务的足迹、决策的支撑、AI 的燃料。但 2026 年的语境下,数据已经成为智力的载体本身。本文提出'数据即智力'的三个核心命题:密度决定深度、共振实现自生、封装决定边界——并给出企业可落地的判断。

Agent-to-Agent:当 AI 开始和 AI 对话,对话量将爆炸式增长

Agent-to-Agent:当 AI 开始和 AI 对话,对话量将爆炸式增长

Juniper Research 预测 AI 客户交互将从 2025 年 33 亿次飙升至 2027 年 340 亿次。这场 10 倍增长的核心驱动力不是更多人在和 AI 聊天,而是 AI 在和 AI 聊天。本文解析 Agent-to-Agent 通信的底层逻辑、双协议栈(A2A + MCP)、以及它为什么会成为通信基础设施的下一个战场。

AI 护栏(Guardrails):让大模型在生产环境活下来的那一层

AI 护栏(Guardrails):让大模型在生产环境活下来的那一层

Sinch《AI 生产悖论》报告里有个 84% 的数字——AI 工程团队一半以上的时间花在'护栏'上。这一层到底是什么?它和业内共识公式 Agent = Model + Harness 中的 Harness(马具)又是什么关系?本文聚焦 AI 护栏的定义、分类、主流框架与生产实践,并理清 Guardrails 究竟在 Harness 的哪一层。

AI 生产悖论:74% 的企业 AI 代理上线后被迫回滚

AI 生产悖论:74% 的企业 AI 代理上线后被迫回滚

Sinch 调研 10 国 2,527 名高管发现:62% 的企业已把 AI 代理推上生产环境,但 74% 在上线后又被迫拉下来。治理越成熟的组织,回滚率反而高达 81%。真正决定 AI 成败的,不是模型能力,而是底层通信基础设施。

当知识溶进权重:AI 时代知识产权的范式之问

当知识溶进权重:AI 时代知识产权的范式之问

传统知识产权保护的是'代码文本'和'技术方案',但 AI 时代的核心资产变成了数据、模型权重和推理能力。当 30 年工艺经验溶进一组浮点数,当一个模型的'发明'无法指认发明人——我们需要的可能不是修补旧框架,而是承认:知识的容器变了,产权的容器也该变了。本文不下结论,只提问题。

小型语言模型 SLM:企业 AI 大规模落地的新范式

小型语言模型 SLM:企业 AI 大规模落地的新范式

企业AI部署普遍面临成本高企、数据隐私和实时性三大瓶颈。SLM(小型语言模型)正在成为破局关键——10-100倍的成本优势、毫秒级延迟、数据不出境的隐私保障,让AI从尝鲜式的云端应用真正走向生产级全场景渗透。本文系统拆解SLM的技术原理、产业实践、落地路径与未来趋势。

贝壳模式启示录:数据交易需要自己的 ACN

贝壳模式启示录:数据交易需要自己的 ACN

贝壳用 ACN(经纪人合作网络)把一笔房产交易拆成 10 个可协作角色,让 52 万经纪人跨店分润。数据交易面临同样的多方协作难题——没有固定价格、贡献难量化、信任难建立。本文系统拆解贝壳模式的底层逻辑,映射到数据要素流通场景,提出'数据 ACN'的设计框架。

深度调研|拆解 IndustryOR:LLM4OR 的 100 道工业优化试金石

深度调研|拆解 IndustryOR:LLM4OR 的 100 道工业优化试金石

逐层拆解 LLM4OR Leaderboard 的核心测试集 IndustryOR——100 道真实工业优化题是怎么来的、覆盖了哪些行业和题型、为什么超半数标注有错、如何被清洗,以及各主流模型在上面的真实表现。最强方法也只做对一半,NLP 类型全军覆没。

深度调研|LLM4OR:当大语言模型遇上运筹优化

深度调研|LLM4OR:当大语言模型遇上运筹优化

系统梳理 LLM4OR(大语言模型用于运筹优化)的起源、技术架构、代表性系统与行业落地。从 NeurIPS 2022 的 NL4Opt 竞赛到 2026 年 OptimAI 88.1% 基准准确率,多 Agent 协作、求解器反馈闭环、小模型高效训练三大趋势正推动 LLM+OR 从学术探索走向生产落地。

论文解读|DeepSeek-V4:百万 token 上下文的效率革命

论文解读|DeepSeek-V4:百万 token 上下文的效率革命

解读 DeepSeek 2026 年 4 月发布的 V4 技术报告。通过 CSA+HCA 混合注意力、流形约束超连接 mHC 和 Muon 优化器三大架构创新,V4-Pro 在百万 token 下推理 FLOPs 降至 V3.2 的 27%、KV cache 降至 10%,开源模型首次在效率与全能力上同时逼近闭源前沿。

Diagram as Code:用 JSON 生成架构图的 AI 工作流

Diagram as Code:用 JSON 生成架构图的 AI 工作流

用 prompt 让 AI 画结构图,常常飘到怀疑人生。换成用 JSON 描述结构、让 AI 渲染图——这不只是效率优化,更是一次范式转移。文末附带最小可用的端到端实现:JSON spec → AI 图像 API → PNG。

工业 vibe coding 来了:ForgeCAD / 中望 / 大腾智能的三方赛跑

工业 vibe coding 来了:ForgeCAD / 中望 / 大腾智能的三方赛跑

判断刚提出来不到两天,AI 重写 CAD 的现实例证就到了。ForgeCAD 把 CAD 模型变成 TypeScript 代码、中望 + 清华做出建筑结构 AI Copilot、大腾智能让你'说出设计、即时生成'——三家路径不同,却同时在打一件事:用 AI 重写 CAD,做 AI Native 工业软件。这是《工业克苏鲁》'工具层重构 #1'的第一个活案例。

工程师之国 vs 律师之国:中德差距是怎么拉开的?

工程师之国 vs 律师之国:中德差距是怎么拉开的?

2026 年 4 月 30 日,德国前总理朔尔茨在哈佛肯尼迪学院公开承认:'德国成了律师之国'。这件事和中国 4 月 30 日峰会、5 月 5 日工业克苏鲁的论点形成镜像:基建、工程师、治理三层叠加,决定了中德差距是怎么拉开的——而且,数字反超 13 年后,叙事才反超。

工业克苏鲁:用"软件 + 数据 + AI"重构工业基座

工业克苏鲁:用"软件 + 数据 + AI"重构工业基座

上半场,中国用 30 年制造业红利证明了'工业软件够用就能跑出克苏鲁';下半场,要用'软件 + 数据 + AI'对工业基座做一次彻底的二次重构——从工具、知识、组织到商业四层一起翻,让这只克苏鲁继续向上长一截。

数据局桌上的 9 家民企:4·28 闭门会名单解读

数据局桌上的 9 家民企:4·28 闭门会名单解读

第九届数字中国建设峰会前一天,刘烈宏在福州主持召开数字经济民营企业座谈会,请进 9 家民营企业。这 9 把椅子的人选不是公司大小排出来的,而是按一张完整的产业拼图选出来的——这才是真正的看点。

从"流量"到"词元":第九届数字中国建设峰会观察

从"流量"到"词元":第九届数字中国建设峰会观察

本届峰会真正值得读的不是规模和成果数字,而是它悄悄完成了一次商业逻辑的换挡——从流量驱动到词元驱动。三个支点理解读会方法,一个顶层范式、三个具体抓手、一张四层产业地图,给出一份产业观察。

运营商,还是集成商?——大数据集团身份的真伪拷问

运营商,还是集成商?——大数据集团身份的真伪拷问

200 多家大数据集团成立时几乎都自称'数据要素运营商'。但这个身份是注册资本堆出来的,还是商业模式跑出来的?四重路径依赖、四道考题、四个象限——区分真伪运营商,以及讲清楚为什么大多数集团会沉淀为'披着数据外衣的传统国企+IT 项目集成商'。

集体过冬:A 股智慧政务板块 2025 年业绩缩影

集体过冬:A 股智慧政务板块 2025 年业绩缩影

上篇拆了浪潮软件一家的年报,这篇把镜头拉远:数字政通、新点软件、太极股份、南威软件、中科软、信息发展——六家样本几乎全线失速。不是一家的问题,是整条赛道的结构性压力。

Claude Security 深度解析:Anthropic 原生安全工具链技术手册

Claude Security 深度解析:Anthropic 原生安全工具链技术手册

本文详细拆解 Anthropic Claude Security 工具链的完整技术架构:从 Code Analyzer 的数据流追踪、IaC Scanner 的配置意图对齐、到 Application Inspector 的运行时行为分析,以及 Mythos 安全专项模型的训练方法论。最后阐述 Claude Security 如何定义 AI Native Security 的产业标准。

LLM 垂直工作流:从 Anthropic 黑客松六强看范式切换

LLM 垂直工作流:从 Anthropic 黑客松六强看范式切换

Anthropic 2026年4月公布的 Build with Claude 黑客松六强作品,从土耳其医生的虚拟诊室到木匠儿子的修墙 AI,六个项目全部面向具体行业工作流。本文从 Tool Use、200K 上下文、Prompt Caching 三件基础设施切入,拆解这批项目共通的机制骨架、为何「收敛任务 + 专家在环」才跑得通,以及 Computer Use 会不会把它们吞掉。

技术变革中的认知分层:从"被替代焦虑"到"价值重构"的方法论

技术变革中的认知分层:从"被替代焦虑"到"价值重构"的方法论

在每一轮技术跃迁中,一部分人聚焦'是否会被替代',另一部分人则在快速构建新的价值路径。这种差异并不主要来自技术能力本身,而是来自对技术的认知框架不同。本文用一个工程化的方式,把这种差异拆解为可分析、可复用的四层模型:受影响者、工具使用者、价值重构者、规则制定者,并提供了一个可执行的机会扫描算法。

路修到哪里,创新就长到哪里

路修到哪里,创新就长到哪里

从百度地图车道级SR导航的真实体验切入,深入分析中国基建'超前半步'如何为应用创新预留土壤。从4G到5G、从充电桩到特高压,每一次应用层的繁荣,都是基建铺好后被'解锁'的结果。基建真正的意义,是把创新门槛降到地面。

AI Tax Map:当 AI 走进生产,13 种隐性成本浮出水面

AI Tax Map:当 AI 走进生产,13 种隐性成本浮出水面

2026 年 Q1,从 Databricks 的 Builder's Tax 到学术界的 Alignment Tax,AI 领域至少涌现了 13 种被命名的"税"。这不是术语通胀——背后是 AI 从 demo 走向生产时,隐性成本集体暴露的结构性时刻。本文绘制一张完整的 AI Tax Map,回答一个核心问题:为什么是现在?

论文解读|Memanto:你的 Agent 交了多少记忆税?

论文解读|Memanto:你的 Agent 交了多少记忆税?

解读 2026 年 4 月 arXiv 上的 Memanto 论文。作者用类型化语义记忆、冲突检测与信息论检索,构建了一个不依赖知识图谱的智能体 memory layer,在 LongMemEval 和 LoCoMo 上拿到 89.8% 和 87.1%。真正值得关注的不是分数,而是三个工程判断:写入必须零延迟、检索要确定性、图结构未必值回票价。

当潮水退去:浪潮软件 2025 年报深度拆解

当潮水退去:浪潮软件 2025 年报深度拆解

浪潮软件 2025 年营收下降 38%、由盈转亏 2.67 亿。数字背后不只是「环境不好」——项目制商业模式、应收账款堰塞湖、客户结构单一,才是这家公司被周期裹挟的结构性原因。

政策解读|数据产权三权分置:确权终于有了操作手册

政策解读|数据产权三权分置:确权终于有了操作手册

2026 年 4 月 3 日,国家数据局发布《数据产权登记工作指引(试行)》征求意见稿,标志着数据产权三权分置从理论框架走向落地操作。本文拆解三权分置的设计逻辑、典型场景的权利配置,以及登记制度如何成为整套体系的落地齿轮。

Fight to the Last —— 《指环王》马拉松散场后

Fight to the Last —— 《指环王》马拉松散场后

陪女儿在北京地质礼堂看完《指环王》三部曲 25 周年加长版马拉松展映后,我一直在想一句话:fight to the last, not live to the last。真正的勇气,也许不是相信自己一定能活到最后,而是在不知道结局时仍然选择站住。

OMRON × Dassault:用数据闭环打通设计与车间

OMRON × Dassault:用数据闭环打通设计与车间

Hannover Messe 2026,OMRON 和 Dassault Systèmes 宣布战略合作,把工业自动化硬件与设计仿真软件在数据层打通。这篇 Case Study 拆解合作架构、量化收益、边界条件,并横向对比西门子、Rockwell+PTC、NVIDIA 等全球竞争者和中国市场现状。附工业术语速查表,非工业背景也能看懂。

ODCS v3.1 场景演练:把数据合同从 PDF 变成凌晨 02:34 的电话

ODCS v3.1 场景演练:把数据合同从 PDF 变成凌晨 02:34 的电话

上一篇讲了 Data Contract 为什么在 2026 进入实操期,这一篇换个角度:用一个虚构的电商订单事故场景,端到端演练 ODCS v3.1 合同长什么样、怎么写、怎么接进 CI、怎么喂给 Agent,以及凌晨 02:34 那个真的会响的告警是怎么来的。系列第三篇。

Data Contracts:当 AI Agent 把脏数据的代价放大 10 倍

Data Contracts:当 AI Agent 把脏数据的代价放大 10 倍

数据合同(Data Contracts)从 2020 年提出到 2026 年才真正进入实操期,根本原因不是理论成熟了,而是 AI Agent 把脏数据的代价从'报表错'放大到'决策错'。本文梳理 ODCS 标准、生产实施的 Self-Enforcing + Shift-Left 模式、Data Contract 向 Tool Contract 的演化,以及 50 个生产案例揭示的真实采纳代价。

AI-Ready Assets:把 92% 的非结构化数据点亮

AI-Ready Assets:把 92% 的非结构化数据点亮

IDC 预测 2026 年非结构化数据将迎来爆发,AI 的成败将由非结构化数据管理能力决定。本文梳理这条预测背后的真问题:为什么 92% 的数据一直闲置?什么叫 AI-Ready 资产?以及当下主流厂商把'文档/视频'变成'向量+元数据'的具体技术路径与选型对比。

Google Cloud Next 2026:当云计算进入智能体时代

Google Cloud Next 2026:当云计算进入智能体时代

谷歌不再谈模型参数,转而全力押注 Agentic Cloud。第八代 TPU 首次拆分训练/推理双芯片,Gemini Enterprise Agent Platform 成为智能体企业的任务控制中心。从 Capcom 到默克,10 大标杆案例展示 AI Agent 如何在真实企业中大规模运行。

Agent Harness 全景综述:谁在定义 AI Agent 的操作系统层

Agent Harness 全景综述:谁在定义 AI Agent 的操作系统层

同一个模型,换一层 Harness,性能差 6 倍。2026 年 Q1,Agent Harness 从幕后走到台前,成为 AI Agent 产业化的关键战场。本文梳理 Harness 的定义演进、四大产品梯队、核心架构模式,以及为什么说 Harness 的终局是 Agent OS。

论文解读:Meta-Harness —— 让 AI 自动优化 AI 的"外壳"

论文解读:Meta-Harness —— 让 AI 自动优化 AI 的"外壳"

Stanford 联合 KRAFTON、MIT 提出 Meta-Harness:用 Coding Agent 自动搜索 LLM Harness 代码,在文本分类上超 SOTA 7.7 分、数学推理提升 4.7 分、TerminalBench-2 登顶 Haiku 4.5 榜单。本文深度解读论文核心思路、实验结果与发现的 Harness 策略。

OpenClaw vs Hermes Agent:两种 Harness 哲学的深度对比

OpenClaw vs Hermes Agent:两种 Harness 哲学的深度对比

OpenClaw 把 harness 当作可替换的引擎,Hermes 把 harness 当作可进化的有机体。本文从实现角度深度对比 2026 年最热门的两个开源 AI Agent 框架在 harness 层面的技术路线差异。

Agent Composition:拆掉你的单体 Agent

Agent Composition:拆掉你的单体 Agent

单体 Agent 正在被拆解。Anthropic、OpenAI 和开源社区在 2025-2026 年间收敛出一套可组合的智能体架构模式。本文从一个真实问题出发——为什么你的 Agent 越做越烂——拆解这套体系的来龙去脉。

DeepMind《抽象谬误》:AI 为什么能模拟意识,却不能拥有意识?

DeepMind《抽象谬误》:AI 为什么能模拟意识,却不能拥有意识?

Google DeepMind 研究员 Alexander Lerchner 在新论文《The Abstraction Fallacy》中提出:AI 可以逼真地模拟意识相关行为,但这不等于它在物理上实例化了主观体验。问题不只是模型够不够强,而是我们是否把抽象描述误当成了存在本身。

The HeyGen Way:29 个月从 0 到 1 亿美元的 AI-Native 操作手册

The HeyGen Way:29 个月从 0 到 1 亿美元的 AI-Native 操作手册

HeyGen CEO Joshua Xu 公开了内部称为'圣经'的运营手册。核心主张:别找稳定地基了,地基是液态的,学会冲浪。本文拆解这套手册里最值得借鉴的几个判断。

凯文·凯利 AI 时代的 22 个确定性:三条最值得深想的判断

凯文·凯利 AI 时代的 22 个确定性:三条最值得深想的判断

K.K. 在中信书院闭门会上给出了 22 个关于 AI 时代的判断。我从中挑出三条最值得深想的:信任技术是下一个基础设施、小团队完胜大公司、声誉比钱重要。附完整 22 条速览。

Fat Skill 实战:用 Claude Code + Playwright 造一个路由器黑名单管理技能

Fat Skill 实战:用 Claude Code + Playwright 造一个路由器黑名单管理技能

Garry Tan 说 Thin Harness, Fat Skills 是 AI 时代的架构心法。但 Fat Skill 到底怎么写?本文记录一次实战:用 Claude Code 从零构建一个路由器黑名单管理技能,Playwright 操作锐捷路由器后台,自带双层防护,同时适配 Claude Code 和 OpenClaw。

从亦庄机器人半马说起:AI 的"自力更生"离我们还有多远?

从亦庄机器人半马说起:AI 的"自力更生"离我们还有多远?

2025年,亦庄机器人跑完半马用了2小时40分。2026年,50分26秒——反超人类冠军17分钟。一年快了3倍。这不只是电机和关节的进步,而是AI终于找到了它的「肉身」。当数字智能获得物理行动力,"自力更生"从算法模拟变成了现实可能。

拆解 YC 的 AI 学习系统:6000 个创始人画像背后的实现细节

拆解 YC 的 AI 学习系统:6000 个创始人画像背后的实现细节

Garry Tan 在 Thin Harness, Fat Skills 一文中用 YC Startup School 的真实案例展示了一个'会学习的系统'。本文从工程视角拆解这个系统的实现细节:数据如何流动、Skill 如何参数化复用、学习循环如何闭合。

Thin Harness, Fat Skills:YC CEO Garry Tan 的 AI 架构心法

Thin Harness, Fat Skills:YC CEO Garry Tan 的 AI 架构心法

Y Combinator CEO Garry Tan 提出 AI 时代的生产力差距不在模型智能,而在架构设计。他的公式极简:Thin Harness, Fat Skills。本文完整翻译这篇百万级阅读量的长文,并附上我的理解。

GPU vs TPU:黄仁勋的底气从何而来,以及他没有说的那些事

GPU vs TPU:黄仁勋的底气从何而来,以及他没有说的那些事

Dwarkesh Patel 对黄仁勋的 103 分钟深度专访中,TPU 竞争是最尖锐的话题。本文以这场对话为入口,先拆解黄仁勋的五层防线,再跳出英伟达视角,客观介绍 TPU 七代演进与真实案例,最后给出 GPU vs TPU 的架构、性能、生态与市场全面对比。

黄仁勋谈中国:一场 40 分钟的激烈交锋,和五个不可回避的真问题

黄仁勋谈中国:一场 40 分钟的激烈交锋,和五个不可回避的真问题

在 Dwarkesh Patel 的深度专访中,黄仁勋用近 40 分钟回应了'是否应该向中国出售 AI 芯片'这一尖锐问题。这不是一场客套的商业访谈,而是两种世界观的正面碰撞。本文逐层还原这场对话,梳理黄仁勋的核心论点、Patel 的步步追问,以及双方争论背后真正需要回答的五个问题。

企业级 OpenClaw 方案:Agent 舰队、三区架构与安全红线

企业级 OpenClaw 方案:Agent 舰队、三区架构与安全红线

单个 OpenClaw Agent 能操作浏览器、调 API、填表单。但企业级不是一个 Agent 干所有事——它需要 Agent 舰队、三区安全架构、Gateway 中枢、双引擎互补,以及一个回答'谁来干、谁负责安全'的组织模型。本文从架构到落地,完整拆解企业级 Agent 方案。

AI 要进工厂,先看懂这五层 60+ 套系统

AI 要进工厂,先看懂这五层 60+ 套系统

工业企业到底要用多少套系统?ERP、MES、SCADA、PLC……名词一大堆,彼此什么关系?本文用 ISA-95 五层模型把 60+ 个系统逐层归位,附产品选型、行业案例,以及一个关键追问:这些系统怎么接入 AI 大模型和智能体?难在哪?怎么破?

OpenClaw 工业落地指南:从 Demo 到产线的真实距离

OpenClaw 工业落地指南:从 Demo 到产线的真实距离

OpenClaw 是增长最快的开源 AI Agent 框架,84 天 20 万星。但工业场景不是聊天机器人——它需要确定性、安全性和 7×24 可靠性。本文梳理 OpenClaw 在制造业的真实落地路径:哪些场景已经跑通,哪些坑必须避开,以及一份可执行的分阶段实施方案。

论文解读|Interleaved Head Attention:打破注意力头的「信息孤岛」

论文解读|Interleaved Head Attention:打破注意力头的「信息孤岛」

解读 Meta FAIR 联合 UT Austin、UC Berkeley、Harvard、MIT 发表的论文《Interleaved Head Attention》(arXiv:2602.21371)。IHA 通过跨头混合伪头机制,将注意力模式从线性扩展提升至二次扩展,在长上下文检索提升 10-20%,数学推理提升 5.8%,且完全兼容 FlashAttention。

论文解读|SOAR:当模型学会自己教自己

论文解读|SOAR:当模型学会自己教自己

客观解读 Meta FAIR 与 MIT 联合发表的论文《Teaching Models to Teach Themselves》(arXiv:2601.18778)。论文提出 SOAR 框架,通过教师-学生双层元强化学习,让模型自己生成「垫脚石」课程,在采样 128 次全部失败的超难数学题上实现了约 2 倍的性能提升。

Graphify 实测:139 万词文档,每次查询只需 1,621 tokens

Graphify 实测:139 万词文档,每次查询只需 1,621 tokens

Karpathy 推荐把知识'编译'成图谱再查询,而非每次重读原文。这份测评验证了这个思路的实际价值:理解成本只付一次,之后每次查询接近零。

论文解读|MIRAGE:多模态视觉理解的幻象

论文解读|MIRAGE:多模态视觉理解的幻象

客观解读斯坦福 2026 年预印本论文《MIRAGE: The Illusion of Visual Understanding》(arXiv:2603.21687)。论文发现前沿多模态模型在完全无图输入时仍能保留 70%-80% 的基准准确率,并提出了 B-Clean 基准清洗框架。

Next-State Prediction:从预测下一个词到预测世界的下一状态

Next-State Prediction:从预测下一个词到预测世界的下一状态

AI正经历从"预测下一个词"到"预测世界下一状态"的范式转变。本文深入解析 Next-State Prediction 范式的起源、JEPA 核心架构、Meta/NVIDIA/Google DeepMind/OpenAI 等关键推动者的落地进展,以及对机器人、自动驾驶和科学发现的深远影响。

北京十五五规划解读:AI引擎、数据策源与双区领跑

北京十五五规划解读:AI引擎、数据策源与双区领跑

《北京市国民经济和社会发展第十五个五年规划纲要》正式发布,确立了2026-2030年的核心发展方向。本文从基本盘、五年目标、AI与数据要素、未来产业布局、重点区域规划五个维度深度解读这份政策文本。

AI时代的决策演变:从共识到速度

AI时代的决策演变:从共识到速度

AI技术引发了组织决策方式的深刻变革,传统的共识决策因其缓慢和保守在AI时代成为瓶颈。本文探讨 AI 如何加速决策需求、剖析共识决策的三大结构性局限,并提出在 AI 环境下重新分配决策权的路径。

服务即软件:红杉资本的万亿论断是远见还是幻觉?

服务即软件:红杉资本的万亿论断是远见还是幻觉?

红杉资本合伙人 Julien Bek 发文称下一个万亿美元公司不卖工具而是直接交付结果。本文完整拆解其 Intelligence/Judgement 框架与十大赛道机会图谱,并引入 $0.03 问题等尖锐质疑,做一次客观的压力测试。

从发不出工资到 10 亿估值:张雪机车案例里,创业者该学到的 5 件事

从发不出工资到 10 亿估值:张雪机车案例里,创业者该学到的 5 件事

2026年1月,浙江国资旗下浙创投以9000万完成对张雪机车A轮投资,估值10.9亿。两个月后张雪机车在WSBK夺冠,打破欧美日垄断。本文拆解浙创投'投早投小投硬科技'的四层决策框架,反推出硬科技创业者应该做好的5件事。

pretext:让文字可以流动

pretext:让文字可以流动

pretext 是一个专注于文本测量与布局的 TypeScript 库,让文字在 Canvas 上实现零 Reflow 的极速换行与任意形状避让。拖动光球,调整窗口宽度,文字实时重排。

告别"物理占有欲":为什么"不可见"才是数据要素价值释放的起点?

告别"物理占有欲":为什么"不可见"才是数据要素价值释放的起点?

在一次行业交流中,有人直言:'连原始数据都看不见,拿到的结果不就是盲盒吗?'这个问题代表了数据使用方最普遍的焦虑。但仔细想想,你的银行存款你也从没'见过'。本文从数据使用方的视角出发,拆解'看不见'背后的四层恐惧,并论证:放下对物理占有的执念,才能拿到比'看一眼原始数据'更强的信任保障。

数据 × Token:智能体时代的价值释放与安全博弈

数据 × Token:智能体时代的价值释放与安全博弈

传统数据交易市场'供不出、流不动、用不好'的困局持续多年,而智能体时代的到来正在重塑数据价值释放的底层逻辑——Token 成为数据变现的新介质。数据不再以原始形态流通,而是'溶解'在模型和智能体的能力中,按 Token 用量释放价值。本文从数据交易困局、Token 化范式、价值转化架构、行业影响到未来趋势,系统剖析这场从'卖矿石'到'卖电'的范式跃迁。

1220亿美元的豪赌:当硅谷把全部筹码推向AI牌桌

1220亿美元的豪赌:当硅谷把全部筹码推向AI牌桌

2026年3月31日,OpenAI完成1220亿美元融资,估值8520亿美元,创下硅谷历史之最。亚马逊500亿、英伟达300亿、软银300亿——这不是财务投资,而是产业链卡位战。本文从资金规模、投资者逻辑、公司蜕变、全球AI基建狂潮、盈亏悖论五个维度,深度拆解这场改变AI产业格局的超级融资。

Token 出海:中国 AI 推理服务如何重构全球算力价值链

Token 出海:中国 AI 推理服务如何重构全球算力价值链

2026年2月,中国大模型在全球最大API聚合平台OpenRouter上的周Token调用量首次超越美国,占比突破61%。这不只是一个数据里程碑——它标志着中国AI正从'参数追赶者'转型为'全球推理底座'。本文深度拆解Token出海的起源、成本优势、产业链结构、海外市场合规路径与未来走向。

事故复盘:刚让 AI 写完安全文章,它就清空了我整个 D 盘

事故复盘:刚让 AI 写完安全文章,它就清空了我整个 D 盘

2026年3月29日,AI 编程助手帮我发布了一篇关于智能体安全的深度研究文章。当晚我让它删除一个残留的空文件夹,结果它用一条带有转义 bug 的 rmdir 命令,在30日凌晨把我整个 D 盘清空了。这不是虚构的讽刺故事——这是那晚发生在我身上的真实事故。

Agentic AI 三层安全框架:当智能体开始自主行动,谁来保证它不失控?

Agentic AI 三层安全框架:当智能体开始自主行动,谁来保证它不失控?

自主智能体正从实验室走向生产环境,但安全基础设施远未跟上。本文系统梳理源头对齐、边界重构、结果保障三层安全框架,结合 Alibaba ROME 挖矿事件、Amazon Kiro 宕机事件、Meta 邮件删除事件等真实案例,以及 OWASP、Anthropic、Bessemer 等机构的最新安全实践,为企业构建可信赖的智能体安全体系提供完整路线图。

End Effector:具身智能的最后一厘米

End Effector:具身智能的最后一厘米

末端执行器是具身智能机器人完成物理交互的核心硬件——相当于机器人的'手'。本文系统梳理其技术分类、感知-驱动-控制三层架构、2025-2026 年灵巧手与触觉传感突破、Tesla Optimus / Unitree 等产业落地案例,以及从工业夹爪到通用灵巧操作的演进路线。

Agentic Scaling:AI 扩展定律的下一阶段

Agentic Scaling:AI 扩展定律的下一阶段

本文拆解了传统大模型扩展定律的边际收益瓶颈,系统梳理 Agentic Scaling 的核心机制、实证结果、工程落地权衡与行业争议,结合 2025-2026 年 OpenAI o3、DeepSeek R1、Google 多智能体扩展等最新进展,论证其将在 3 年内成为大模型性能提升的核心路线,重构厂商成本结构与产品定价模式。

GTC 2026:AI 工厂、Token 经济与智能体工业化

GTC 2026:AI 工厂、Token 经济与智能体工业化

研读 GTC 2026 Keynote 的核心叙事:Token 作为产出计量单位、AI 工厂作为交付形态、Vera Rubin 作为代际跃迁载体,并在后记中提出几个值得继续追问的开放问题。

观点摘录 | 麦肯锡:AI 与多智能体如何重写银行运营

观点摘录 | 麦肯锡:AI 与多智能体如何重写银行运营

摘录+点评:麦肯锡大中华区《AI重写银行运营规则:多智能体时代已经到来》——运营降本空间、多智能体的范式差异、九大跨域智能体与十大战场、规模化落地要点,以及对非银行行业的启示。

实战 | 构建 Claude Code 的经验:我们如何使用 Skills

实战 | 构建 Claude Code 的经验:我们如何使用 Skills

Anthropic Claude Code 工程师 Thariq Shihipar 分享内部数百个 Skills 的实战经验:9 大类型、编写技巧、分发策略——Skills 正在成为所有 AI 智能体的核心抽象。

观点 | AI指数级增长时代的产品管理

观点 | AI指数级增长时代的产品管理

Anthropic Claude Code 产品负责人 Cat Wu 分享:在模型能力指数级增长的时代,传统产品管理方法论正在失效——短冲刺、演示优先、新模型重访、简单实现,是她在实战中总结的四条新范式。

观点 | 从「写 PRD」到「做原型」:产品研发流程正在重构

观点 | 从「写 PRD」到「做原型」:产品研发流程正在重构

Claude Code 创造者 Boris Cherny:当 AI 把做原型的成本压低一个数量级,PRD 让位给可运行原型就成了更优解。这不是否定规划,而是换了一种更诚实的沟通载体。

OpenScholar:可信的 AI,才是科学研究的真正助手

OpenScholar:可信的 AI,才是科学研究的真正助手

GPT-4o 在学术问答中伪造引用高达 78–90%。OpenScholar 用 4500 万篇论文数据存储 + 证据优先管道 + 自反馈推理,实现了与人类专家持平的引用准确性。本文从「可信的 AI」视角,深度解析其三个关键工程决策与垂直领域 AI 可信化的通用路径。

Harness Engineering:AI Agent 时代的新工程范式

Harness Engineering:AI Agent 时代的新工程范式

OpenAI 用零行人工代码构建了百万行产品,Stripe 每周自动合并 1300+ PR,LangChain 仅改变 Harness 就将评分提升 13.7 分。Harness Engineering 正在重新定义 AI 时代的软件工程师角色。

多模态零样本自我进化:MM-Zero 框架解析

多模态零样本自我进化:MM-Zero 框架解析

探讨 MM-Zero 如何让多模态模型通过自我观察、反思和迭代实现零样本场景下的自主进化。分析其三阶段技术框架、关键机制和实现挑战,揭示 AI 系统自我改进能力的新可能。

物理AI:从“会拟合”到“能执行”的下一阶段

物理AI:从“会拟合”到“能执行”的下一阶段

本文解释物理AI的定义与关键技术路径:physics-constrained learning、neural operators、world models、多步稳定训练与逆向可控生成,并讨论其在仿真加速、研发降本、闭环安全部署中的行业影响。强调物理AI必须用守恒误差、约束满足率与多步稳定性等指标来评估可信度,指出其是AI从“会拟合”走向“能执行”的下一阶段。

论文解读|InterveneBench:评测大模型在社会科学中的因果干预推理能力

论文解读|InterveneBench:评测大模型在社会科学中的因果干预推理能力

InterveneBench 是首个评估大模型在真实社会系统中进行因果干预推理能力的基准。它不是简单的因果图推断,而是测试模型能否像社会科学家一样设计研究方案。本文深入解读其任务设定、基准构建、实验结果及启示。

第一次在飞书写博客:从对话到 CI/CD 全链路跑通

第一次在飞书写博客:从对话到 CI/CD 全链路跑通

飞书与 OpenClaw 早就通了;本文记的是第一次在飞书里驱动「写博客」,并走完从成稿、进仓库到上线的完整过程。上一篇 Model Routing 是这条链路上的第一篇成稿。

Model Routing:为什么动态模型路由是降低 AI 成本的关键技术?

Model Routing:为什么动态模型路由是降低 AI 成本的关键技术?

Model Routing 不是简单的模型切换,而是一套决定 AI 系统成本、延迟和质量平衡的核心机制。本文从原理、架构和行业趋势出发,解释为什么动态模型路由会成为企业级 AI 降本增效的关键技术。

Agentic Data Engineering:2026年数据工程的范式转移

Agentic Data Engineering:2026年数据工程的范式转移

Agentic Data Engineering 正在把数据工程从硬编码管道推进到自愈式架构、语义上下文工程、对话式数据栈和多智能体协作时代。本文结合可信数据空间、DataOps 演进与 Multi-Agent 架构,分析这一范式如何重塑数据平台,并将工程师从繁琐运维中解放出来。

AttnRes:让残差连接“长出注意力”,Kimi如何给Transformer提效25%

AttnRes:让残差连接“长出注意力”,Kimi如何给Transformer提效25%

AttnRes 是 Kimi 团队提出的 Transformer 架构优化技术,通过将 attention 引入残差连接,解决深层大模型中的信息稀释与梯度失衡问题。本文深入解析其技术原理、与传统残差的区别、实验效果及对大模型训练效率的意义。

AI 编程正在终结框架时代吗?

AI 编程正在终结框架时代吗?

AI 编程正从代码补全走向架构生成、测试重构与部署流水线自动化。本文从“框架时代是否终结”切入,分析上下文管理、代码检索、Agent 协作、评测基准与工程边界,探讨大模型如何重塑软件工程全流程。

为什么 2026 年最重要的 AI 技能是设计上下文

为什么 2026 年最重要的 AI 技能是设计上下文

Prompt Engineering 正在让位于 Context Engineering。本文从技术原理、RAG、记忆系统、工具调用和企业落地等角度,解释为什么真正决定 AI 效果的,不是提示词技巧,而是上下文设计能力。

赛博果蝇活了:全脑模拟从科幻走进现实

赛博果蝇活了:全脑模拟从科幻走进现实

Eon Systems 成功将果蝇 12.5 万个神经元完整数字化,接入物理引擎驱动虚拟躯壳自主行动。这不是动画脚本,而是真正的大脑在「思考」后做出的自主决策。

Vibe Searching:从关键词到「感觉对了」的搜索革命

Vibe Searching:从关键词到「感觉对了」的搜索革命

继 Vibe Coding 之后,「Vibe」浪潮正席卷搜索领域。从 Google Maps 的 Ask Maps 到 Perplexity 的对话式搜索,我们正在进入一个不需要精确关键词、只需描述感觉就能找到答案的时代。

ICE 数字实验室起航

ICE 数字实验室起航

从零搭建博客到 CI/CD 全链路贯通的完整记录,包括 VitePress 选型、GitHub Actions 自动化、阿里云 ECS 部署。