引言
前几天和一位做制造业的朋友聊天,他的吐槽很有代表性:
“花了半年时间选型,光服务费就砸了小几十万,终于上了套‘号称能自动做根因分析’的 Agent。
我问它‘Q3合格率怎么掉这么多?’它张嘴就来:‘设备参数异常。’
结果你猜怎么着?我们拉着设备部加班调了 3 天参数,最后查来查去 —— 压根不是设备的事,是两批次来料没做检验!”
后来才发现:数据库里根本没‘来料检验结果’这个字段,AI只能从现有数据里‘瞎猜’。”
这两年AI Agent火得一塌糊涂,很多企业都觉得“只要用上Multi-Agent、RAG这些技术,就能让AI帮业务解决所有问题”。
但从我们服务雀巢、三一重工等1000+企业的实践来看,AI Agent的“智能”,从来不是技术单方面决定的——它更像一个“数据翻译官”,数据给的是“通顺的原文”,它才能输出“精准的译文”;数据要是“错字连篇、逻辑混乱”,再牛的翻译技巧也没用。
今天就从“数据与Agent的关系”聊聊,为什么说“准备好数据,才是AI Agent项目的真正开始”。
一、第一个真相:AI Agent不会“无中生有”,它的推理全靠数据“喂料”
很多人对AI Agent有个误解:觉得它能像数据分析师一样,“没数据也能靠经验补”。
但实际上,Agent的所有推理、分析、结论,都来自于它能获取到的数据——就像医生看病需要“病历+检查报告”,Agent做分析也需要“准确的数据+清晰的业务规则”,少一样都得“误诊”。
之前有个零售客户,用AI Agent查“8月华北门店客单价下降”,AI给出的原因是“高单价商品销量下滑”,但业务端实际情况是“华北区域搞了‘满200减50’活动,很多客户拆单购买,单客消费次数变多但单次金额降了”。
为什么Agent没看出来?因为数据库里“订单是否参与满减”这个字段是空的,Agent只能看到“客单价降了”和“高单价商品销量降了”,自然推导不出“拆单”这个真实原因。
这就是Agent的本质:它没有“业务经验”,只有“数据处理能力”。
你给它“满减活动参与标记”,它才能关联“客单价”和“拆单行为”;你不给,它就只能在现有数据里找“最相关”的因素,哪怕这个因素和实际业务没关系。
有时候不是Agent突然变“聪明”了,是数据给了它“看到真相的眼睛”。
二、第二个真相:Agent的“准确率”,其实是数据“无歧义性”的镜子
很多企业验收AI Agent项目时,总盯着“测试环境准确率95%”这个数字,但到了业务场景就频繁翻车——问题不在Agent的技术,而在“测试数据”和“业务数据”的差距。
测试数据往往是“干净的”:指标定义唯一(“销售额”就是“不含税销售额”)、字段命名清晰(“门店_月度销售表_2024”)、关联关系明确(“门店ID”唯一关联);
但业务数据却是“混乱的”:“销售额”可能有“含税”“不含税”“应收”三个版本,字段名是“t_sale_amt”,关联字段既有“门店ID”又有“门店编码”。
Agent面对这种“混乱数据”,就像你让一个外国人读“错别字连篇的中文文章”——不是他中文不好,是文章本身没法读。
我们之前帮某家电企业整改时,光是把“销售额”的三个版本统一成“月度有效销售额(不含税,剔除退货)”,并在Data Formula(我们的数据中台工具)里做了唯一标注,Agent的问数准确率就从72%涨到了98%。
所以别再问“为什么我的Agent准确率低”,先问“你的数据有没有歧义”。比如“客单价”是“销售额/客户数”还是“销售额/订单数”?“复购客户”是“1年内下单2次”还是“3个月内下单2次”?
这些定义如果没在数据里明确,Agent就只能“二选一”,准确率自然上不去。
三、第三个真相:Agent的“决策价值”,取决于数据是否“嵌入业务规则”
现在很多AI Agent能出“洞察报告”,但不少报告都是“正确的废话”——比如“销售额下降10%”,却没说“哪些订单算有效订单”“哪些库存算滞销”。
原因很简单:这些业务规则只在业务文档里,没嵌入到数据中,Agent根本“看不见”。
某快消客户的案例很典型:他们的“有效订单”定义是“支付时长<24小时+无退货”,但这个规则只存在销售部门的SOP里,数据库里只有“订单金额”“支付时间”“退货状态”三个独立字段。
Agent查“月度有效订单数”时,只能自己算“支付时间<24小时且无退货的订单”,但因为“支付时间”字段有部分格式错误(有的是“2024-08-01”,有的是“2024/08/01”),导致计算结果少了15%。
后来我们帮他们做了两件事:
一是在Data Flow里统一了“支付时间”格式,二是在数据库里新增了“有效订单数”专属字段,把“支付时长<24小时+无退货”的规则直接嵌入字段计算逻辑。
之后Agent查这个指标,直接调用字段就行,不仅准确率100%,还能关联“有效订单数下降”和“支付超时订单增加”的关系,给出“优化支付提醒流程”的建议——这才是Agent该有的“决策价值”。
Agent的核心价值不是“算数据”,而是“把业务规则转化为数据洞察”。
四、不是Agent不行,是你没给它“能干活的数据”
聊到这里,可能有人会说:“数据准备这么麻烦,还不如让分析师手动算。”
但从我们服务1000+企业的经验来看,数据准备不是“麻烦”,而是“给Agent搭好干活的架子”——一旦架子搭好,Agent能释放的价值远超想象。
比如雀巢,在我们帮他们梳理完1400+SKU的指标定义、嵌入200+业务规则后,AI Agent不仅能实时回答“华东区域Q3哪个SKU的Sell-Out下降最快”,还能自动关联“经销商库存”“门店拜访记录”,给出“优先清库存+增加重点门店拜访”的方案;
之前需要5个分析师花1周做的“月度经营报告”,现在Agent5分钟就能生成,还能自动标注“异常数据”和“改进建议”。
再比如某制造企业,数据准备好后,Agent查“生产线合格率下降”,能直接定位到“某批次原材料的硬度不达标”,而之前分析师需要查3个系统、对比10张表才能找到原因——这就是“数据就绪”后,Agent的效率优势。
五、结语:我们不做“技术炫技”,只帮你让Agent“真正有用”
这10年,我们没少见过“技术堆砌”的Agent项目:用了Multi-Agent、RAG,甚至自定义了LLM,但因为数据没准备好,最终变成“演示时好用,实际用不了”的摆设。
所以我们始终坚持一个原则:做AI Agent,先做“数据就绪”。
不是我们的技术不行,而是从1000+企业的实践来看,“数据就绪”才是Agent项目的“地基”——地基不稳,再高的技术大楼也会塌。所以我们做的事情,本质是帮企业搭好这个“地基”。
我们服务雀巢、三一重工、OPPO这些企业时,从来不是先推“我们的Agent多厉害”,而是先帮他们做好数据准备——因为我们知道,只有数据就绪了,Agent的技术才能落地,才能真正帮业务提效。
如果你不知道从哪里开始,我们可以帮你:用1000+企业的实践经验,帮你梳理指标、清洗数据、嵌入规则,让你的Agent一上线就“能用、好用、管用”。
毕竟,我们做的不是“卖Agent”的生意,而是“帮企业用Agent解决问题”——问题解决了,Agent的价值自然就来了。