数据不靠谱，AI Agent再牛也是烧钱！

引言

前几天和一位做制造业的朋友聊天，他的吐槽很有代表性：

“花了半年时间选型，光服务费就砸了小几十万，终于上了套‘号称能自动做根因分析’的 Agent。
我问它‘Q3合格率怎么掉这么多？’它张嘴就来：‘设备参数异常。’
结果你猜怎么着？我们拉着设备部加班调了 3 天参数，最后查来查去 —— 压根不是设备的事，是两批次来料没做检验！”

后来才发现：数据库里根本没‘来料检验结果’这个字段，AI只能从现有数据里‘瞎猜’。”

这两年AI Agent火得一塌糊涂，很多企业都觉得“只要用上Multi-Agent、RAG这些技术，就能让AI帮业务解决所有问题”。

但从我们服务雀巢、三一重工等1000+企业的实践来看，AI Agent的“智能”，从来不是技术单方面决定的——它更像一个“数据翻译官”，数据给的是“通顺的原文”，它才能输出“精准的译文”；数据要是“错字连篇、逻辑混乱”，再牛的翻译技巧也没用。

今天就从“数据与Agent的关系”聊聊，为什么说“准备好数据，才是AI Agent项目的真正开始”。

一、第一个真相：AI Agent不会“无中生有”，它的推理全靠数据“喂料”

很多人对AI Agent有个误解：觉得它能像数据分析师一样，“没数据也能靠经验补”。

但实际上，Agent的所有推理、分析、结论，都来自于它能获取到的数据——就像医生看病需要“病历+检查报告”，Agent做分析也需要“准确的数据+清晰的业务规则”，少一样都得“误诊”。

之前有个零售客户，用AI Agent查“8月华北门店客单价下降”，AI给出的原因是“高单价商品销量下滑”，但业务端实际情况是“华北区域搞了‘满200减50’活动，很多客户拆单购买，单客消费次数变多但单次金额降了”。

为什么Agent没看出来？因为数据库里“订单是否参与满减”这个字段是空的，Agent只能看到“客单价降了”和“高单价商品销量降了”，自然推导不出“拆单”这个真实原因。

这就是Agent的本质：它没有“业务经验”，只有“数据处理能力”。

你给它“满减活动参与标记”，它才能关联“客单价”和“拆单行为”；你不给，它就只能在现有数据里找“最相关”的因素，哪怕这个因素和实际业务没关系。

有时候不是Agent突然变“聪明”了，是数据给了它“看到真相的眼睛”。

二、第二个真相：Agent的“准确率”，其实是数据“无歧义性”的镜子

很多企业验收AI Agent项目时，总盯着“测试环境准确率95%”这个数字，但到了业务场景就频繁翻车——问题不在Agent的技术，而在“测试数据”和“业务数据”的差距。

测试数据往往是“干净的”：指标定义唯一（“销售额”就是“不含税销售额”）、字段命名清晰（“门店_月度销售表_2024”）、关联关系明确（“门店ID”唯一关联）；

但业务数据却是“混乱的”：“销售额”可能有“含税”“不含税”“应收”三个版本，字段名是“t_sale_amt”，关联字段既有“门店ID”又有“门店编码”。

Agent面对这种“混乱数据”，就像你让一个外国人读“错别字连篇的中文文章”——不是他中文不好，是文章本身没法读。

我们之前帮某家电企业整改时，光是把“销售额”的三个版本统一成“月度有效销售额（不含税，剔除退货）”，并在Data Formula（我们的数据中台工具）里做了唯一标注，Agent的问数准确率就从72%涨到了98%。

所以别再问“为什么我的Agent准确率低”，先问“你的数据有没有歧义”。比如“客单价”是“销售额/客户数”还是“销售额/订单数”？“复购客户”是“1年内下单2次”还是“3个月内下单2次”？

这些定义如果没在数据里明确，Agent就只能“二选一”，准确率自然上不去。

三、第三个真相：Agent的“决策价值”，取决于数据是否“嵌入业务规则”

现在很多AI Agent能出“洞察报告”，但不少报告都是“正确的废话”——比如“销售额下降10%”，却没说“哪些订单算有效订单”“哪些库存算滞销”。

原因很简单：这些业务规则只在业务文档里，没嵌入到数据中，Agent根本“看不见”。

某快消客户的案例很典型：他们的“有效订单”定义是“支付时长＜24小时+无退货”，但这个规则只存在销售部门的SOP里，数据库里只有“订单金额”“支付时间”“退货状态”三个独立字段。

Agent查“月度有效订单数”时，只能自己算“支付时间＜24小时且无退货的订单”，但因为“支付时间”字段有部分格式错误（有的是“2024-08-01”，有的是“2024/08/01”），导致计算结果少了15%。

后来我们帮他们做了两件事：

一是在Data Flow里统一了“支付时间”格式，二是在数据库里新增了“有效订单数”专属字段，把“支付时长＜24小时+无退货”的规则直接嵌入字段计算逻辑。

之后Agent查这个指标，直接调用字段就行，不仅准确率100%，还能关联“有效订单数下降”和“支付超时订单增加”的关系，给出“优化支付提醒流程”的建议——这才是Agent该有的“决策价值”。

Agent的核心价值不是“算数据”，而是“把业务规则转化为数据洞察”。

四、不是Agent不行，是你没给它“能干活的数据”

聊到这里，可能有人会说：“数据准备这么麻烦，还不如让分析师手动算。”

但从我们服务1000+企业的经验来看，数据准备不是“麻烦”，而是“给Agent搭好干活的架子”——一旦架子搭好，Agent能释放的价值远超想象。

比如雀巢，在我们帮他们梳理完1400+SKU的指标定义、嵌入200+业务规则后，AI Agent不仅能实时回答“华东区域Q3哪个SKU的Sell-Out下降最快”，还能自动关联“经销商库存”“门店拜访记录”，给出“优先清库存+增加重点门店拜访”的方案；

之前需要5个分析师花1周做的“月度经营报告”，现在Agent5分钟就能生成，还能自动标注“异常数据”和“改进建议”。

再比如某制造企业，数据准备好后，Agent查“生产线合格率下降”，能直接定位到“某批次原材料的硬度不达标”，而之前分析师需要查3个系统、对比10张表才能找到原因——这就是“数据就绪”后，Agent的效率优势。

五、结语：我们不做“技术炫技”，只帮你让Agent“真正有用”

这10年，我们没少见过“技术堆砌”的Agent项目：用了Multi-Agent、RAG，甚至自定义了LLM，但因为数据没准备好，最终变成“演示时好用，实际用不了”的摆设。

所以我们始终坚持一个原则：做AI Agent，先做“数据就绪”。

不是我们的技术不行，而是从1000+企业的实践来看，“数据就绪”才是Agent项目的“地基”——地基不稳，再高的技术大楼也会塌。所以我们做的事情，本质是帮企业搭好这个“地基”。

我们服务雀巢、三一重工、OPPO这些企业时，从来不是先推“我们的Agent多厉害”，而是先帮他们做好数据准备——因为我们知道，只有数据就绪了，Agent的技术才能落地，才能真正帮业务提效。

如果你不知道从哪里开始，我们可以帮你：用1000+企业的实践经验，帮你梳理指标、清洗数据、嵌入规则，让你的Agent一上线就“能用、好用、管用”。

毕竟，我们做的不是“卖Agent”的生意，而是“帮企业用Agent解决问题”——问题解决了，Agent的价值自然就来了。