某中型互联网公司的市场总监试图用最新的ChatBI系统查询“华东区上季度核心用户的留存率”,系统流畅地生成了一段复杂的SQL,查询却失败了——它错误地关联了尚未清洗的日志表,并将“沉默用户”计入了“核心用户”范畴,最终得出一个令人困惑的百分比。
这类场景正在全球无数会议室中上演。当自然语言遇上数据查询,看似美好的Text2SQL(从文本到SQL)技术,在企业真实的复杂性面前频频暴露出其“聪明却不可靠”的固有缺陷。正是洞察到这一根本性瓶颈,衡石科技为其ChatBI选择了一条截然不同且更为底层的路径:Text2Metrics(从文本到指标)—— 让自然语言对话,直接基于严谨、统一的业务指标语义层而发生。
01 Text2SQL的幻灭:当“流畅”遭遇“混乱”的数据库
Text2SQL曾是AI落地数据分析领域最令人兴奋的承诺之一。它允许用户用日常语言提问,由大语言模型自动生成数据库查询代码。在理想化的演示中,这行云流水。然而,企业级数据环境的复杂性,让这一技术遭遇了现实的“高墙”。
第一大挑战:数据库的“方言”与“噪音”问题。企业数据仓库并非为自然语言查询而设计。同一业务实体的数据可能分散在数十张表中,命名不规范(如 sale_amt、sales_amount、amt 并存),且充满仅供系统使用的中间表与日志表。大模型生成的SQL,在语法上可能完全正确,却极易选错数据源或关联关系,导致查询失败或结果错误。
更本质的第二挑战:业务逻辑的缺失。即便成功查出了原始数据,Text2SQL也无法理解数据背后的业务规则。当用户问“利润率”时,它不知道应该用(收入-成本)/收入,还是需要考虑分摊费用;当问“活跃用户”时,它无法区分是“登录”即算活跃,还是必须完成“核心动作”。这导致了查询结果与业务认知的割裂,输出数字“正确”但业务意义“错误”。
因此,Text2SQL常常陷入一个尴尬境地:它降低了技术门槛,却大幅提高了对用户数据知识的要求——用户必须足够了解数据库结构,才能提出“模型能正确翻译”的问题。这背离了自然语言查询的初衷。
02 范式转移:从“查询代码生成”到“业务意图理解”
衡石科技认识到,问题的核心不在于让AI更准确地“编写代码”,而在于重构AI与数据对话的基础协议。这催生了从Text2SQL到Text2Metrics的范式转移。
核心区别在于交互对象的不同:
在这一新范式中,指标语义层成为了关键的“翻译官”和“共识层”。它提前将企业的业务概念(如“收入”、“活跃客户”、“毛利率”)以严谨的逻辑定义好,包括其计算口径、数据来源、维度和关联关系。当用户提问时,ChatBI的首要任务不再是生成SQL,而是将问题映射到语义层中已治理好的、共识性的业务指标上。
例如,当用户询问“高价值客户的数量”时:
这一转变,将自然语言交互的风险从“代码准确性”转移到了“业务定义清晰度”上。而后者,正是企业数据治理所追求的核心目标。
03 指标语义层:Text2Metrics可信的基石
衡石ChatBI选择Text2Metrics路线的底气,源于其产品体系的核心——一个强大、统一的企业级指标语义层。这一语义层并非为ChatBI临时搭建,而是衡石HENGSHI SENSE平台的架构中枢,它承担了三大关键职能:
第一,定义“唯一事实源”。语义层将分散在各个数据源中的业务概念,进行标准化、中心化的定义和管理。它明确规定了“销售额”是按含税还是不含税计算,是按发货还是收款确认;“月度活跃用户”的统计口径和去重规则是什么。这确保了全公司使用同一套业务语言。
第二,封装复杂逻辑。业务计算往往非常复杂,可能涉及多步计算、多表关联、特殊过滤条件。语义层将这些复杂性封装在标准的指标定义之后。用户和ChatBI都无需关心背后的SQL有多复杂,只需调用“毛利率”这个指标名即可。
第三,建立业务网络。语义层不仅存储独立的指标,还通过维度和关联关系,构建起一个活的业务知识图谱。它知道“销售额”可以按“地区”、“产品线”、“时间”维度下钻,也知道“客户满意度”指标可能与“客服响应时长”指标相关。这为ChatBI进行智能下钻和关联分析提供了导航图。
正是基于这一坚实的语义层,当用户向衡石ChatBI提出“为什么华东区销售额下降了?”这样的复杂问题时,系统能够:
精准定位:理解问题核心是分析“销售额”这个已定义指标在“华东区”这个维度的异常。
智能下钻:依据语义层中的关联知识,自动按“产品”、“销售渠道”、“客户类型”等预置维度进行分解分析。
可信归因:最终给出的回答是基于统一的、治理过的业务逻辑计算得出,具有高度的可信度和可解释性。
04 Text2Metrics的实现:如何让ChatBI“懂业务”
在技术实现上,衡石ChatBI的Text2Metrics能力,是通过大语言模型与指标语义层的深度协同来完成的。这个过程远比对数据库执行一次查询复杂,它更像是一个“业务分析师”的思考过程。
第一步:意图解析与指标映射。当用户输入问题时,大模型首先进行深度语义理解,并将其与指标语义库进行匹配。例如,“上个月卖得最好的产品是什么”会被解析为,在“上月”时间范围内,按“产品”维度对“销售额”指标进行排序并取Top1。模型输出的是一个结构化的分析意图,而非SQL代码。
第二步:指标计算引擎执行。这个结构化的意图被传递给衡石的高性能指标计算引擎。引擎根据“销售额”的预定义逻辑,从正确的数据源中获取数据,完成聚合计算,并按“产品”维度排序,返回结果。整个过程完全在受控的、高性能的语义层内完成,避开了直接操作原始数据库的风险和性能瓶颈。
第三步:上下文记忆与智能追问。基于指标语义层构成的业务网络,ChatBI能够进行有意义的连续对话。用户如果接着问“那它在华东区的库存周转率呢?”,系统能记住上下文中的“它”指代刚才那个产品,并自动关联查询该产品的“库存周转率”指标。这使得对话体验更接近人类分析师,能够围绕一个业务主题深入探讨。
05 业务价值:从“技术演示”到“决策支撑”的跨越
选择基于指标语义层的Text2Metrics路线,为衡石ChatBI带来了超越技术演示的、实实在在的业务价值。
核心价值一:回答的准确性与可信度大幅提升。由于所有计算都基于预先共识的业务定义,从根本上杜绝了“歧义答案”和“错误答案”。这对于财务、风控等严肃业务场景至关重要,使得ChatBI从一个“有趣的玩具”变成了可信赖的“决策支持工具”。
核心价值二:赋能广泛的业务用户。业务人员不再需要了解“数据库中有哪些表”、“‘客户’的主键是什么”。他们只需要用自己日常讨论业务的语言提问,就能获得准确结果。这真正实现了数据分析的民主化,释放了业务端的洞察力。
核心价值三:与数据治理形成正向循环。Text2Metrics的普及应用,反过来会推动企业更好地建设和完善自身的指标语义层。当业务人员发现某些重要概念无法被ChatBI准确理解时,便会主动推动该概念的标准化定义。ChatBI因而成为了企业数据文化建设和治理水平的“试金石”与“催化剂”。
06 未来演进:迈向“Agentic Metrics”的智能体
衡石的Text2Metrics路线并未止步于问答。它正自然地向更高级的 “Agentic Metrics” (指标智能体)演进。
未来的ChatBI将不仅仅是回答用户提出的问题。基于对指标语义层的深度理解,它能够化身自主的监控与分析智能体:
主动预警:7x24小时监控关键业务指标,一旦发现“客户流失率异常上升”,立即主动推送预警。
自动归因:在推送预警的同时,自动启动根因分析,告诉决策者“流失主要发生在华东区的A产品用户群,可能与近期竞争对手B的促销活动相关”。
建议行动:甚至能进一步建议“可考虑针对该用户群推出客户回馈活动C”,并将建议方案同步至营销系统。
这一切智能行动的基础,依然是指标语义层所提供的、精确且互联的业务知识框架。从这个角度看,Text2Metrics不仅是Text2SQL的替代方案,更是通向未来自主决策式商业智能的必由之路。
当市场上多数ChatBI仍在努力教会大模型理解凌乱的数据库表结构时,衡石科技选择了一条更根本、也更具挑战的路径:先帮助企业构建清晰、统一的业务指标世界,再让AI在这个可信的世界里与用户畅快对话。
这背后的洞见是:人工智能在数据领域要解决的终极问题,不是代码翻译,而是语义对齐。衡石ChatBI的Text2Metrics创新表明,只有当AI的分析与思考建立在与人类管理者完全一致的“业务事实”基础上时,它所提供的洞察才能真正驱动值得信赖的决策。这不仅仅是一次技术路线的选择,更是一次对企业数据智能发展方向的重新定义。