Skip to content

观点 | AI指数级增长时代的产品管理

封面

文章来源

本文编译自 Anthropic 官方博客 Product management on the AI exponential,原作者 Cat Wu(Claude Code 产品负责人),发布于 2026 年 3 月 19 日。

Cat Wu 曾在 Scale AI、Dagster 做产品工程师,后转入风险投资,2024 年 8 月加入 Anthropic。她在文中以第一人称讲述:当模型能力以指数速度跃升时,产品团队该如何调整节奏、重新定义角色边界,以及她个人在 Claude Code 团队中总结出的四条实践原则。

主要观点

  • 前提在变:传统 PM 假设「项目起点与终点的技术边界大致相同」。模型快速迭代打破了这一前提——设计时的约束可能在项目中途消失,团队需要围绕「地面不断抬升」这一现实重新组织。
  • 新节奏:快速实验、持续交付、对有效方向加倍投入。PM 的核心职责变成了在模糊中创造清晰、推动更大胆的可能性、扫清交付障碍。
  • 工具分工:作者日常分为三条线——Claude.ai(策略对话与思考伙伴)、Claude Code(原型、脚本、评测)、Cowork(邮件、文档、日程等知识工作)。业内同行也印证了「想法→原型」周期被大幅压缩。
  • 数据锚点:METR 研究显示,前沿模型可完成的软件任务从人类等效约 21 分钟提升到约 12 小时——约 16 个月内跃升约 41 倍。
  • 四条实践:短周期冲刺 + 支线实验(side quest)、演示与评测优先于文档、新模型发布后主动重访已有功能、优先做简单可替换的实现。
  • 心态:PM 需要在「可控体验」与「为速度放手」之间取舍,识别少数不可妥协点,同时持续关注两条线——AI 如何改变工作方式,以及 AI 如何扩展产品的可能性边界。

译文

自 2024 年 10 月 Claude Sonnet 3.5 发布以来,我养成了一个习惯:每次有新模型,都让 Claude Code(当时还是内部工具)给 Excalidraw 添加一个表格功能。每一代模型都比上一代走得更远,但依然会失败。

随着 2025 年 6 月 Opus 4 的发布,Claude 开始偶尔成功了。我们索性把这个练习做成 Claude 4 发布会的预录演示,展示最新模型的能力上限。

不到一年后,Opus 4.6 已经可以稳定地一次性完成 Excalidraw 功能需求——我们甚至敢在数千名专业开发者面前现场直播。

模型进步的速度在不断扩大可能性边界。传统产品管理方法论建立在一个假设之上:项目开始时技术上可行的东西,到项目结束时大致还是可行的。产品经理提前收集信息、做出赌注、按计划执行数月。

指数级进步的模型打破了这个假设。 你设计时所依赖的约束条件可能在项目中途就消失了——你是在一块不断升高的地面上建造东西,团队必须围绕这个现实重新组织。新的产品管理节奏是:快速实验、持续交付、在有效的方向上加倍投入。

作为 Anthropic 的产品经理,我最常被问到的问题就是:我们的角色正在发生怎样的变化?以下是我的经验总结。

我的 Claude Code 产品管理之路

我的职业生涯始于 Scale AI 和 Dagster 等初创公司,做产品工程师;后来成为风险投资人,但仍然会写代码来自动化工作中枯燥的部分——在 X 平台上扫描新公司公告、检测开源项目的增长势头。

2024 年 8 月我加入 Anthropic,担任研究 PM 团队的产品经理,这个团队连接研究侧与真实用户,交付更好的模型。那年秋天 Claude Code 在内部可用后,我用它加速了大量手工环节:构建 Streamlit 应用分析大规模用户反馈、运行评估帮公司寻找值得信任的新基准。低构建门槛也让我能探索超出本职范围的领域,比如创建强化学习环境来理解训练过程。

这些项目花费了数百小时与 Sonnet 3.5 驱动的 Claude Code 交互,但没有一行代码是手写的

设计新的产品管理工作流

Claude Code 和 Cowork 这样的工具正在模糊产品开发生命周期中的角色边界。随着时间推移,我形成了三条产品线的自然分工:

  • Claude.ai — 思考伙伴。在这里讨论战略文档、处理棘手情况、快速获取答案,不需要它采取行动。
  • Claude Code — 代码输出。构建原型、评估脚本,其中许多会调用 Claude API。当产出是代码时,我用这个。
  • Cowork — 知识工作。收件箱清零、待办跟踪、创建幻灯片、搜索 Slack 了解决策历史、预订工作旅行——代码之外的一切。

行业内的其他产品经理也找到了自己版本的这套工作流:

"Claude 提升了优秀产品团队的天花板,极大缩短了想法到原型之间的距离。过去要花数周才能把可验证的成果放到客户面前。现在我从 Claude Cowork 开始,拉取 Slack、代码库和文档的上下文,再进入 Claude Code,几小时内就有可演示的东西。优秀团队一直会用真实客户测试想法,这个本能没变;变的是我们能通过这个循环测试多少高质量想法。" — Bihan Jiang,Decagon 产品总监

"在 AI 原生世界做 PM,既是创造性的也是学术性的。每次模型发布都会改变可能性边界。在构建 Datadog 的 Bits AI SRE 代理时,我们通过真实生产事件的离线评估来研究模型的优势与失败模式,并设计紧密的反馈循环,让智能体遇到的困难浮出水面,把洞见转化为产品改进。PM 的手艺已从提前定义确定性,转变为加速发现。" — Kai Xin Tai,Datadog 高级产品经理

最令人兴奋的是,这些工作流还在不断进化,持续带来更大的杠杆效应。

拥抱 AI 指数增长

METR. (2026, March). Task-Completion Time Horizons of Frontier AI Models. metr.org/time-horizons

METR 发现,大约一半情况下,Opus 4.6 能完成人类需要近 12 小时才能完成的软件任务。而我们最初构建 Claude Code 时,Sonnet 3.5 是前沿模型,METR 测量它只能完成人类约 21 分钟的任务。约 16 个月,提升约 41 倍。

METR 人类等效时长与范式对照

Claude Code 团队也在进化以跟上模型改进的速度。我们的角色正在融合:设计师提交代码,工程师做产品决策,产品经理构建原型和评测。这之所以行得通,是因为清晰的战略和目标让每个人都能自主排定优先级。产品经理的工作就是:在快速模型进步制造的模糊中创造清晰,推动团队思考更大的可能性,并为更快交付扫清障碍。

以下是我们拥抱的四个转变:

四个转变:机制与文中例证

1. 短周期冲刺规划

传统 PM 思维把探索当作路线图锁定之前要完成的事:先做研究、写 PRD,再交给工程团队构建。

我们的做法不同——鼓励团队中每个人(工程师、PM、设计师)去做支线任务(side quest):在官方路线图之外进行的短期自主实验。花一个下午原型化一个想法,测试你认为遥不可及的能力,或者只是看看把模型推到极限会发生什么。

Anthropic 一些最受欢迎的功能——Claude Code 桌面版AskUserQuestion 工具待办列表——都是这样诞生的。

2. 演示和评测胜过文档

我们团队已基本用原型优先思维取代了文档优先思维。不开传统站会,而是分享新想法的演示;内部用户试用后,那些真正获得参与度的会被打磨并更广泛地分享。因为一个下午就能出原型,错误下注的成本很低。

例如,Noah 把他的插件规范发给 Claude Code,返回的原型已经接近生产就绪。那个原型锚定了团队最终交付的方向,因为它让所有人快速验证了 UX。

实操建议:写完规范后,发给 Claude Code 看它能构建出什么。即使是粗糙的原型也能改变对话走向。

除了演示,评测也能让抽象产品变得具体。为了让多个 Claude Code 实例协同工作的智能体团队功能,Conner 手工设计了一组评测,量化智能体团队在什么条件下表现良好、什么条件下失败、以及需要修复什么。能度量才能改进。

3. 用新模型重访旧功能

你发布了一个功能,然后更好的模型出来了——你的功能可以变得显著更好。每个模型版本的发布都是一个隐式提示:重新审视已经构建的东西。

捕捉这些时刻的最佳方法是成为日活用户,并刻意让模型去做你认为可能太难的事。一旦它成功了,就是产品需要追赶的信号。

Claude Code with Chrome 就是这样诞生的。我们注意到用户用 Claude Code 构建 Web 应用后,手动切换到 Chrome 里的 Claude 来测试——在两个工具之间复制粘贴指令。这个拼凑方式已经够用了,我们意识到它应该成为内置功能。如果用户在自发拼凑某个工作流,那就是你可以产品化的脚手架。

原型化这些想法时,始终优先验证能力,而非控制成本。大方地使用 token——过早削减 token 成本并交付能力缩水的产品是一个常见错误。成本可以在更便宜的模型跟上之后再优化,但首先你得知道这件事到底能不能做。

4. 做简单的事情

在 Anthropic,每个团队都有一条指导原则:做简单可行的事情(Do the simple thing)

如果你的产品巧妙地绕开了某个模型局限,那当下一代模型发布时,这个变通方案就变成了多余的复杂性。实现越简单,在新能力到来时替换就越容易。

一个真实案例:我们初次在 Claude Code 里推出待办列表时,模型无法可靠地在完成任务后勾选条目。于是我们每隔几条消息插入一个系统提醒,定期「推」模型更新待办状态。管用,但终究是权宜之计。到了下一代模型,这个行为自然就有了,提醒被彻底移除。我们反复看到这一模式:系统提示词和工具描述曾被大量工程化以弥补模型不足,而每个新版本都能精简一轮——Opus 4.6 的提示词规模比前代减少了约 20%。

展望未来

许多产品经理习惯了对完整产品体验的紧密控制,但 AI 时代推动你放手才能更快前进。构建 AI 产品的感觉像冲浪——最重要的事就是待在浪上。作为完美主义者,这是我最难适应的转变;但 PM 的角色现在就是识别少数真正不可妥协的东西,然后放手其余一切。

这些转变的净效果是产品团队可以显著提速。当 PM 能在一个下午从想法走到可用原型,「如果我们试试……」和「来,试试这个」之间的距离几乎消失了。

在 Anthropic,不只是产品经理在用 Claude 重塑工作流。数据科学、金融、营销、法律设计——各团队都自发地用上了这些工具。整个组织以同一速度前进,不再需要等待交接。

PM 现在需要同时跟踪两条线:AI 如何改变你的工作方式,以及 AI 如何改变你产品中的可能性边界。做好这一点,当那个 Excalidraw 表格工具最终成功时,你不会感到惊讶——你就是那个预见到它会到来的人。


原文作者:Cat Wu,Anthropic Claude Code 产品负责人。

原文链接:Product management on the AI exponential