作者:HENGSHI
时间:2025-09-05
标签:
衡石科技
AI
Agentic BI
Data Agent
AI Agent
在传统商业智能(BI)领域,用户往往被困在一个“被动查询”的循环中:提出问题时需要预先知道数据在哪、如何关联、怎样编写查询语句;获取答案后,又会产生新的问题,周而复始,极大地限制了数据洞察的深度和效率。衡石科技认为,下一代智能数据分析平台不应是一个需要人工持续驱动的“问答机”,而应是一个能够主动理解意图、自主完成任务、并持续提供洞察的“合作伙伴”。这一愿景的核心,便是其基于 AI+Data Agent 架构对平台进行的重构。
本文将深入解析衡石科技这一技术架构的核心设计与实现原理。
一、 传统架构的瓶颈与范式转移
传统的数据分析平台通常构建于一个三层架构之上:数据存储层、计算引擎层 和 应用可视化层。尽管稳定,但其瓶颈明显:
高度依赖人工:从数据建模、SQL编写到看板制作,每一步都严重依赖数据工程师或分析师的专业技能。
响应滞后:业务人员的一个新问题,需要经过提需求-排期-开发-验证的漫长流程,无法应对高速变化的业务场景。
洞察浅层:大多局限于对历史数据的描述性分析,难以自动完成归因、预测等深度分析。
衡石科技的范式转移在于,在原有三层架构中注入一个全新的“智能大脑”—— Agentic Layer(智能体层),使平台从“工具”进化成为“智能体”。
二、 衡石AI+Data Agent架构的核心三层
重构后的平台架构可概括为以下三层:
1. 统一语义层(Unified Semantic Layer):智能体的“知识库”
这是所有Data Agent协同工作的基石。它远不止是一个简单的数据字典,而是一个强大的“知识图谱”,其中不仅定义了指标、维度、业务实体及其关系,还沉淀了企业的业务逻辑和数据治理规则(如数据权限、质量校验规则)。
2. Data Agent 框架:智能体的“大脑与手脚”
这是架构的神经中枢。衡石平台并非只有一个单一的Agent,而是部署了一系列高度专业化、各司其职的Data Agent,通过协同工作完成复杂任务。主要包括:
意图理解Agent(Intent Agent):基于自然语言处理(NLP)和大语言模型(LLM),解析用户以自然语言提出的问题(如“分析一下上个月华东地区客户流失率下降的原因”)。它能将模糊的业务语言转化为精准的技术指令,包括识别涉及的指标、维度、过滤条件和分析类型。
查询生成与优化Agent(Query Agent):接收Intent Agent的指令,基于统一语义层,自动生成高效、合规的SQL或其它查询语句。它具备查询优化能力,能选择最优的数据源和计算路径。
洞察推荐Agent(Insight Agent):这是平台实现“主动智能”的关键。它不仅仅回答用户提出的问题,还会自动进行数据探查,发现数据中隐藏的异常点、显著趋势、关键贡献因子等,并主动推送给用户。例如,它可能会自动完成归因分析,告诉用户“流失率下降主要得益于某款新产品的上线”。
工作流自动化Agent(Orchestration Agent):负责协调和管理多个Agent之间的协作顺序,处理复杂任务链。例如,完成从数据提取、清洗、分析到生成报告并发送邮件的全自动化流程。
3. 智能应用层(Agentic BI Applications):智能体的“交互界面”
在这一层,各种Data Agent的能力被封装成具体的产品功能,交付给最终用户。
自然语言问答:用户可以直接输入问题,获得答案、图表甚至完整的看板。
自动化报告与预警:Agent可以定期自动运行分析,并将发现的核心洞察通过报告、消息推送等方式主动告知业务人员。
智能归因与预测:用户只需点击一个异常指标,系统背后的Insight Agent便会自动启动,快速定位根因并提供预测性建议。
三、 技术实现的关键亮点
LLM + Domain Knowledge的有效结合:衡石没有单纯依赖通用大模型,而是将其与自家的统一语义层、指标中台等领域知识深度结合。通过微调(Fine-tuning)和检索增强生成(RAG)等技术,让LLM能够精准理解企业内部的业务术语和数据上下文,避免了“ hallucinations”(幻觉)问题,输出可靠结果。
Agent的确定性与可靠性:尽管基于概率模型的LLM具有不确定性,但衡石通过让Agent在严格定义的语义层和规则框架内行动,确保了最终数据输出的确定性和可靠性。例如,查询生成Agent输出的SQL一定是符合数据治理规范的。
可扩展的Agent生态:该架构允许开发者为特定场景(如营销效果分析、供应链预警)定制专属Agent,并接入平台,不断丰富整个生态的分析能力。
四、 总结
衡石科技通过引入 AI+Data Agent 架构,成功地将数据分析平台从一种“静态的、被动的”工具,重塑为一个“动态的、主动的、可进化的”数据伙伴。其核心创新在于:
知识化:通过统一语义层将数据转化为机器可理解的业务知识。
Agent化:通过一系列专业Data Agent将分析过程自动化、智能化。
主动化:最终在应用层实现从“人找数”到“数找人”的范式革命。
这不仅是技术的升级,更是产品理念的颠覆。它极大地降低了数据消费的门槛,释放了业务人员的潜能,让企业每一个决策都能得到实时、深度、主动的数据支撑,真正步入“Agentic BI”的新时代。
