Graphify 实测：139 万词文档，每次查询只需 1,621 tokens

一个越来越明显的问题

用 AI 编程助手（Claude Code、Cursor、Copilot……）工作久了，会发现同一个问题反复出现：

AI 没有记忆。 每次开新会话，它对你的项目一无所知。你要么把相关文件重新粘贴进来，要么让 AI 自己去扫代码。前者费 token，后者费时间，而且每次会话都要重来一遍。

项目越大，这个摩擦越重。139 万词的文档集合远超任何模型的上下文窗口，根本没法整体喂进去；分批喂又失去了整体的语义连接。

常见的解法是 RAG（向量检索）——把文档切片存入向量库，查询时检索相似片段再喂给模型。听起来合理，但本质上还是"每次查询都在读文件"，只不过换成了自动检索。

RAG vs Graphify

另一个思路：先编译，再查询

Andrej Karpathy 在一个视频里提了一个不同的观点：

把 LLM 当编译器用，而不是当搜索引擎用。

什么意思？传统知识管理的思路是"存原始数据，查的时候再理解"——每次查询都重新理解一遍。Karpathy 的思路是反过来：先把原始数据编译成结构化知识，之后查的是结构，不是原始数据。理解成本只付一次。

就像代码编译：你不会每次运行程序都重新读源码，而是先编译成可执行文件，之后直接运行。知识管理也应该这样——先"编译"成图谱，之后直接查图谱。

Graphify 是这个思路的一个工程实现。

Graphify 做了什么

一句话：把你的项目文件一次性转换成一张持久化的知识图谱，之后 AI 查图谱回答，不再打开原始文件。

它根据文件类型走两条路：

语料类型	处理方式	API 消耗
代码（14 种语言）	本地 AST 解析（Tree-sitter）	零
文档 / PDF / 图片	调用 Claude LLM / Vision API	有

代码有固定语法结构，Tree-sitter 在本地就能把类、函数、调用关系解析出来，不需要调任何 API。文档没有语法，只能靠 LLM 理解语义——这是代码建图免费、文档建图要花钱的根本原因。

建完图后，用户提问时 AI 在图谱上遍历，只取相关子图送给模型——不是原始文件，不是向量片段，而是已经提炼好的节点和关系。

不只是省 token

知识图谱的四个价值维度

省 token 是结果，不是全部价值。更重要的是图谱能做到 RAG 做不到的事。

多跳推理。 RAG 检索的是"和问题相似的片段"，本质是一跳查找。图谱查询的是预计算好的关系链：A 调用 B，B 依赖 C，C 影响 D——这种跨节点的路径推理，向量检索做不到。

跨文档综合。 实测中，graphify 综合了 5 个不同版本的架构文档，推断出两个核心平台之间的层次嵌套关系。这个结论从未在任何一篇文档中被明确陈述——它是跨文档语义推理的产物，读任何单篇文档都得不到。

隐式依赖暴露。 代码实验里，图谱发现了 PowerShell 与 Bash 路径校验逻辑之间靠约定维系的隐式耦合。代码里没有 import，人工 code review 几乎不会注意到这种依赖，图谱把它显式化了。

架构诊断。 图谱自带结构性信号：连接数最高的节点（God Nodes）是项目里最核心的抽象，新人上手时最应该先看；社区聚合度低的模块说明职责边界不清，是重构信号；推断型关系（INFERRED）标注了每条边的置信度，让你知道哪些依赖是确定的、哪些是推测的。

实测数据

跑了两个对照实验，验证代码和文档两种场景下的真实效果。

	代码型语料	文档型语料
语料规模	184 个 .ts 文件，约 42,666 tokens	76 个文件（含 PDF、图片），约 185 万 tokens
建图成本	$0，3–5 分钟	$15，约 1 小时
Token 压缩倍率	31.8x	1,143x
每次查询费用	$0.13 → $0.004	$5.56 → $0.005
回本点	立即（零建图成本）	约 3 次查询

代码场景没有任何门槛：本地 AST 解析完成全部建图，不花一分钱，每次查询省 30 倍 token。

文档场景需要前期投入，但回收极快：139 万词压缩成 1,621 tokens 的查询，1,143 倍压缩，每次查询从 $5.56 降至 $0.005，3 次查询即可覆盖建图成本。

什么时候值得用

图谱的价值来自"摊销"——建图是一次性投入，之后每次查询都在回收。

频繁查询的知识库，ROI 极为显著。 代码场景直接上；文档场景适合长期维护的项目文档库、技术资产库。

一次性阅读的语料没必要建图。 如果这批文件看完就不会再查，建图投入无法摊销，直接喂给模型更划算。

本质上，graphify 不让模型变聪明——它让模型的注意力变高效：告诉模型"往哪看、什么连着什么"，把理解成本从每次查询时前置到建图时。

测评环境：Claude Code 2.1.97 · graphify v0.2.1 · Claude Sonnet 4.6

Graphify 实测：139 万词文档，每次查询只需 1,621 tokens ​

一个越来越明显的问题 ​

另一个思路：先编译，再查询 ​

Graphify 做了什么 ​

不只是省 token ​

实测数据 ​