Skip to content

ICE 数字实验室AI · 数据 · 多模态 — 用技术日志沉淀每日探索

Agent 查数的准确率悬崖:语义层 vs Text-to-SQL

Agent 查数的准确率悬崖:语义层 vs Text-to-SQL

2023 到 2026,大模型写 SQL 的能力翻了一倍(dbt 实测 32.7%→64.5%)。但在真实企业库上,同一批模型从 86% 跌到 10%——这就是‘准确率悬崖’。本文用 dbt、Spider 2.0、BEAVER、Snowflake、Atlan 五组一手基准,拆清楚 Agent 查数到底卡在哪:不是模型不够聪明,而是决定答案对错的语义、口径、权限,根本不在数据库的 schema 里。结论是行业已经收敛的同一个答案——把缺失的上下文做成基础设施(语义层),让查询在编译期被治理,而不是事后补救。

模型越来越便宜,AI 创业反而更难:一道绕不开的推理经济学题

模型越来越便宜,AI 创业反而更难:一道绕不开的推理经济学题

token 单价从 2023 年至今跌了 90% 以上,可企业的 AI 账单不降反增、还在翻倍。这不是临时的 bug,而是结构性的:很多人还指望‘等推理再便宜点毛利就好了’,方向恰恰错了。本文拆解这道绕不开的推理经济学题——为什么 agentic 把 token 当柴烧(Stanford:单个 agent 任务比普通对话多烧 1000 倍 token)、为什么创业公司在交一笔躲不掉的‘token tax’(用零售价的智能、对手用成本价)、AI 原生产品毛利为何被锁在 SaaS 之下 30 个点,以及两条逃生路(自研推理、按结果计费)各自的代价。

当 agent 自己查数据:旧治理假设失效,新栈长什么样

当 agent 自己查数据:旧治理假设失效,新栈长什么样

过去二十年,企业数据治理建立在一个朴素假设上:是人来查数据——提个工单、等审批、在自己权限内看报表。AI agent 把这个假设掀翻了:它持续、以机器速度、探索式地发起成百上千次查询,不排队、不等审批。这意味着工单式权限、静态角色、事后审计这套老办法在 agent 面前会成批失守。本文从公开基准(Spider 2.0、BEAVER)讲清楚危险不止是泄露、更是‘自信的错答’,再用一个厂商中立的七层治理模型,把‘从自然语言到一行数据’这条路重做一遍:身份、语义层、策略编译、查询校验、受控执行、响应防护、审计可回放,并诚实地划出它与跨组织数据流通之间的边界。

工业数据“采、集、用”瓶颈:政策解码,难在‘用’

工业数据“采、集、用”瓶颈:政策解码,难在‘用’

工信部启动‘工业数据筑基行动’,公布先行先试联合体名单,把工业数据的难题精准切成‘采、集、用’三段。这篇政策解码不平均用力——采和集是入场券,‘用’才是终局,也是最容易被低估的一环。本文先讲清三段瓶颈与‘1+4+N’政策框架,再重点拆解‘用不好、用不深、用不久’的三层病灶:数据集质量配不上工业 AI、应用场景浅层化、生态与安全滞后,并把工业数据从静态资源走向动态生产力的路径拆成一个可落地的应用阶梯。

数据不动,指针先行:Komprise TFT 与非结构化数据的“零搬迁”范式

数据不动,指针先行:Komprise TFT 与非结构化数据的“零搬迁”范式

企业 80% 以上的数据是非结构化的,却有约 99% 对 AI 是“暗”的——不是因为没价值,而是因为没 schema、质量差、搬不动。6 月 23 日 Komprise 发布的 Transparent File Tables 给了一个反直觉的解法:不搬一个文件,先把全局元数据和指针做成一张 Apache Iceberg 表丢进湖仓,让 Snowflake/Databricks 直接查;真要原始文件时才按需搬运。本文拆解它的原理、与“全量 ETL 拷贝”和“湖仓外部表”的差别,以及它背后那条正在成形的大趋势:把 AI 带到数据身边,而不是把数据搬到 AI 身边。