Skip to content

Graphify 实测:139 万词文档,每次查询只需 1,621 tokens

封面

一个越来越明显的问题

用 AI 编程助手(Claude Code、Cursor、Copilot……)工作久了,会发现同一个问题反复出现:

AI 没有记忆。 每次开新会话,它对你的项目一无所知。你要么把相关文件重新粘贴进来,要么让 AI 自己去扫代码。前者费 token,后者费时间,而且每次会话都要重来一遍。

项目越大,这个摩擦越重。139 万词的文档集合远超任何模型的上下文窗口,根本没法整体喂进去;分批喂又失去了整体的语义连接。

常见的解法是 RAG(向量检索)——把文档切片存入向量库,查询时检索相似片段再喂给模型。听起来合理,但本质上还是"每次查询都在读文件",只不过换成了自动检索。

RAG vs Graphify


另一个思路:先编译,再查询

Andrej Karpathy 在一个视频里提了一个不同的观点:

把 LLM 当编译器用,而不是当搜索引擎用。

什么意思?传统知识管理的思路是"存原始数据,查的时候再理解"——每次查询都重新理解一遍。Karpathy 的思路是反过来:先把原始数据编译成结构化知识,之后查的是结构,不是原始数据。理解成本只付一次。

就像代码编译:你不会每次运行程序都重新读源码,而是先编译成可执行文件,之后直接运行。知识管理也应该这样——先"编译"成图谱,之后直接查图谱。

Graphify 是这个思路的一个工程实现。


Graphify 做了什么

一句话:把你的项目文件一次性转换成一张持久化的知识图谱,之后 AI 查图谱回答,不再打开原始文件。

它根据文件类型走两条路:

语料类型处理方式API 消耗
代码(14 种语言)本地 AST 解析(Tree-sitter)
文档 / PDF / 图片调用 Claude LLM / Vision API

代码有固定语法结构,Tree-sitter 在本地就能把类、函数、调用关系解析出来,不需要调任何 API。文档没有语法,只能靠 LLM 理解语义——这是代码建图免费、文档建图要花钱的根本原因。

建完图后,用户提问时 AI 在图谱上遍历,只取相关子图送给模型——不是原始文件,不是向量片段,而是已经提炼好的节点和关系。


不只是省 token

知识图谱的四个价值维度

省 token 是结果,不是全部价值。更重要的是图谱能做到 RAG 做不到的事。

多跳推理。 RAG 检索的是"和问题相似的片段",本质是一跳查找。图谱查询的是预计算好的关系链:A 调用 B,B 依赖 C,C 影响 D——这种跨节点的路径推理,向量检索做不到。

跨文档综合。 实测中,graphify 综合了 5 个不同版本的架构文档,推断出两个核心平台之间的层次嵌套关系。这个结论从未在任何一篇文档中被明确陈述——它是跨文档语义推理的产物,读任何单篇文档都得不到。

隐式依赖暴露。 代码实验里,图谱发现了 PowerShell 与 Bash 路径校验逻辑之间靠约定维系的隐式耦合。代码里没有 import,人工 code review 几乎不会注意到这种依赖,图谱把它显式化了。

架构诊断。 图谱自带结构性信号:连接数最高的节点(God Nodes)是项目里最核心的抽象,新人上手时最应该先看;社区聚合度低的模块说明职责边界不清,是重构信号;推断型关系(INFERRED)标注了每条边的置信度,让你知道哪些依赖是确定的、哪些是推测的。


实测数据

跑了两个对照实验,验证代码和文档两种场景下的真实效果。

代码型语料文档型语料
语料规模184 个 .ts 文件,约 42,666 tokens76 个文件(含 PDF、图片),约 185 万 tokens
建图成本$0,3–5 分钟$15,约 1 小时
Token 压缩倍率31.8x1,143x
每次查询费用$0.13 → $0.004$5.56 → $0.005
回本点立即(零建图成本)约 3 次查询

代码场景没有任何门槛:本地 AST 解析完成全部建图,不花一分钱,每次查询省 30 倍 token。

文档场景需要前期投入,但回收极快:139 万词压缩成 1,621 tokens 的查询,1,143 倍压缩,每次查询从 $5.56 降至 $0.005,3 次查询即可覆盖建图成本。


什么时候值得用

图谱的价值来自"摊销"——建图是一次性投入,之后每次查询都在回收。

频繁查询的知识库,ROI 极为显著。 代码场景直接上;文档场景适合长期维护的项目文档库、技术资产库。

一次性阅读的语料没必要建图。 如果这批文件看完就不会再查,建图投入无法摊销,直接喂给模型更划算。

本质上,graphify 不让模型变聪明——它让模型的注意力变高效:告诉模型"往哪看、什么连着什么",把理解成本从每次查询时前置到建图时。


测评环境:Claude Code 2.1.97 · graphify v0.2.1 · Claude Sonnet 4.6