引言
这两年我们见过太多企业,花几十万买的智能问数产品,最后只落得个"Demo"的下场。
厂商在会议室里演示得天花乱坠:你随便问,什么都能答。99.9%的SQL准确率,秒级返回结果,图表自动生成。
老板当场拍板:买!
结果上线即废。
业务部门:"Demo里问什么都对,一到真实业务就答非所问。"
数据部门:"同一个GMV,三个部门查出三个数,天天吵架,最后还是得我手动算。"
负责人:"它只会给一堆的数字,永远不会告诉我为什么会这样,更不会说接下来该怎么办。"
所有人都在骂大模型不行。说等GPT-5出来,等下一代模型能力再强一点,这些问题自然就解决了。
但Data Hunter见过上百个智能问数项目的生死,想说句真话:
智能问数不行,真的跟大模型没关系。
一、智能问数走的两条路,其实是死胡同
现在市面上所有的智能问数产品,都在拼一个数字:SQL生成准确率。
95%、98%、99.9%,数字越标越高,PPT越做越炫。好像只要这个数字做到100%,所有问题就都迎刃而解了。
但我想问一句:企业真的需要一个更会写SQL的机器吗?
你去问问任何一个业务人员,他们问数据的时候,想要的是什么?
不是一个字段,而是“这个月我卖了多少钱,跟上个月比是涨了还是跌了,为什么会这样,接下来我该怎么办”。
这些问题,没有一个是SQL能回答的。
一个写得完美无缺的SQL,如果用错了表、用错了口径,出来的就是垃圾数据。而垃圾数据,比没有数据还可怕,它会让你基于错误的结论做出错误的决策。
可整个行业都在假装看不见这个问题。大家都在比谁的翻译能力更强,却没人愿意停下来想一想:用户真正需要的,到底是什么?
正是对这个问题的不同回答,让行业分化出了两条主流路线。但遗憾的是,这两条路,从根上就走不通。
第一个坑:给旧BI打个"AI补丁",越补越烂
这是绝大多数传统BI厂商的选择。成本最低,见效最快。
原来的架构一点不动,只是给数据集加一层注释:这个字段叫什么,是什么意思,属于哪个主题。然后告诉大模型:“你照着这些注释去理解业务,然后写SQL就行。”
昨天还是个普通BI,今天贴个AI标签,价格就能翻三倍。 但它的致命缺陷,会在上线两个月后集中爆发。
我见过最夸张的一家制造企业,最开始只有10个数据集,维护起来轻轻松松。随着业务发展,数据集变成了100个、500个。每个数据集都有自己的规则和口径。
同一个“用户”,在用户表是“注册用户”,在订单表是“下单用户”。
同一个“销售额”,有的包含退款,有的不包含;
最后你会发现,维护这些静态注释的成本,比雇一整个数据团队还高。更可怕的是,当规则多到一定程度,连管理员自己都搞不清哪个是对的。
智能问数就这样变成了“猜数游戏”。用户问一个问题,系统随机返回一个结果,谁也不敢信,谁也不敢用。

第二条死路:建一个“完美”的语义层
为了解决口径不一致的问题,一些厂商提出了“语义层”的概念。听起来特别美好:我们提前把所有指标、维度、规则都统一建模,做成企业的“单一事实来源”。以后所有人都用同一套口径,再也不会吵架了。
现实呢?搭建一套完整的语义层需要多久?
3个月起步,半年是常态。你需要拉着销售、市场、运营、财务所有部门的人开会,一个指标一个指标地对齐定义,一条规则一条规则地梳理清楚,然后再由技术人员一条条写进系统里。
等你终于把所有指标都定义好了,抬头一看,业务早就变了。
618促销规则改了,新的业务线上线了,公司的组织架构调整了。你花了半年时间、几百万成本建的语义层,一夜之间就过时了。
有个客户跟我说,他们刚把语义层建完第二天,公司宣布拆分了两个事业部,所有的组织架构维度全废了。6个月的投入,直接打了水漂。
这种"先治理后使用"的模式,完全颠倒了主次。不是系统去适配业务,而是让业务去迁就系统。
这就是为什么很多企业花了几百万建语义层,最后业务部门还是宁愿用Excel自己算。

二、两条路的共同死穴:用静态业务去对抗动态业务
很多人没有意识到,这两条看似对立的路线,其实共享同一个底层逻辑:
用预先定义的静态语义,去覆盖无限可能的动态业务。
无论你是把语义写在数据集里,还是写在语义层里,它都是死的、固化的、提前想好的。但真实的业务是活的、变化的、永远超出你预设的。
你永远不可能提前定义好所有的业务问题。而企业最有价值的那些提问,恰恰是那些没人想到过的问题。
更致命的是,它们都依赖单一大模型来完成所有工作。
让一个大模型同时承担需求理解、口径对齐、取数计算、分析推理、报告生成的所有任务,就像让一个人同时做产品、开发、测试、运营、客服。 哪怕他再聪明,也必然顾此失彼。
这就是为什么哪怕SQL生成准确率做到100%,智能问数依然不好用。因为它解决的只是"怎么写SQL"的问题,而企业真正需要解决的,是"怎么理解业务、怎么分析数据、怎么给出可信结论"的问题。

三、真正能落地的智能问数,核心是“复刻分析师团队”,而不是“写SQL”
很多人觉得,只要大模型足够强大,就能一个人搞定从理解问题、写SQL、取数、分析到给出结论的全部工作。
但这就像让一个刚毕业的大学生,同时兼任需求分析师、数据工程师、数据分析师和业务顾问。 他可能SQL写得很好,但他不懂你们公司的业务黑话。
他可能懂一点业务,但他不知道哪张表的数据是准的,哪个指标有坑。
他可能知道数据的坑,但他不知道怎么结合业务场景给出有价值的建议。
这不是能力问题,是分工问题。
一个优秀数据团队,从来都不是一个人单打独斗,而是一个分工明确、高效协作的团队。
- 有人负责跟业务沟通需求,把模糊的问题变清晰;
- 有人负责对齐指标口径,确保所有人说的是同一个东西;
- 有人负责写SQL取数,保证数据准确;
- 有人负责做根因分析,找到问题的本质;
- 有人负责写报告,把复杂的数据变成可执行的决策建议。
大家各司其职,互相校验,互相补位,才能最终输出一个业务敢信、能用、能落地的分析结果。
回到原来的问题:智能问数的终局是什么?
不是一个能写所有SQL的大模型,而是能完美复刻一个专业数据分析团队的工作流。
多Agent的智能问数,是给每个环节,都配一个专业的智能体,让它们像真实的团队一样,分工协作,闭环完成整个分析任务。
这不是技术概念的堆砌,而是智能问数唯一能从Demo走向落地的正确路径。
这也是我们DataHuter基于十年企业数据服务经验,打磨出的可落地的解决方案。我们打造的Data Neo数据分析决策智能体,彻底抛弃了"单一大模型做翻译"的老路,用Multi-Agent多智能体架构,完整复刻了一个专业数据分析团队的全流程工作。
1.意图澄清Agent:先懂你,再做事
它就像你们公司那个最懂业务的需求对接人。 当你问"上个月的销售额怎么样"的时候,它不会直接给你一个数,而是会主动问你:
"请问你指的是全渠道还是线上渠道?
是含税还是不含税
是确认收入还是订单金额?"
没有一句废话,只把模糊的业务问题,收敛成无歧义的分析任务。从根源上杜绝"答非所问"。

2.语义治理Agent:边用边治理,打破死局
针对语义层"覆盖窄了不够用,覆盖宽了做不起"的行业死局,Data Neo用语义治理Agent给出了完美解法。
它会自动学习企业的指标体系、口径规则、业务术语,自动完成字段映射、实体对齐、口径统一。不用人工一条条写死规则,更不用投入巨大的成本做一次性的语义层建设。
系统越用越懂业务,所有的分析过程都会自动沉淀到语义体系里,形成正向循环。

3.根因分析+决策建议Agent:从"返回数据"到"输出洞察"
传统智能问数的终点是"返回数据和图表",而Data Neo的起点是"分析数据"。 当你问"为什么5月的GMV同比下降了15%",Data Neo不会只给你一个下降的数字。它会自动启动多Agent协同分析,最终你得到的,不是一堆看不懂的表格,而是这样清晰的结论

四、最后想说
大家被 “一句话取数” 的美好愿景吸引,一头扎进去,最后却困在 Demo 里,走不进真实的业务场景。然后把失败归因为模型不够强,等着下一代大模型来拯救。
但其实,能拯救智能问数的,从来不是更强的翻译能力,而是对企业数据分析本质的理解。
企业需要的,从来不是一个会写SQL的机器,而是一个能懂业务、能控风险、能给结论、能帮决策的智能伙伴。
而这条路,只有多Agent协作能走通。
