在传统BI的世界里,数据分析遵循着一个固定的剧本:用户提出问题,系统返回答案。这个剧本已经上演了数十年,但它有一个根本性的缺陷——用户必须知道要问什么。
现实中,大多数业务问题并不是以“问题”的形式出现的。它们隐藏在数据的细微波动里,潜伏在指标的异常变化中,只有当问题已经造成影响后,用户才会意识到“应该问点什么”。这时候,往往已经错过了最佳干预时机。
衡石科技的Agentic BI试图改写这个剧本。它的核心是一个具备感知、思考、行动能力的AI代理。这个代理不等待用户提问,而是持续监控数据、主动发现异常、深入分析原因、自动推送洞察,并在需要时触发行动。本文将深入解密这一AI代理的技术架构,揭示“感知-思考-行动”闭环的实现原理。
一、整体架构:三层一体的代理大脑
衡石Agentic BI的AI代理采用三层一体的架构设计:
┌─────────────────────────────────────────────────────────────┐
│ 行动层(Act) │
│ (洞察推送、行动建议、API调用、工作流触发) │
└─────────────────────────────────────────────────────────────┘
↑
┌─────────────────────────────────────────────────────────────┐
│ 思考层(Think) │
│ (意图理解、任务规划、归因分析、决策生成) │
└─────────────────────────────────────────────────────────────┘
↑
┌─────────────────────────────────────────────────────────────┐
│ 感知层(Sense) │
│ (数据监控、异常检测、上下文捕获、用户行为分析) │
└─────────────────────────────────────────────────────────────┘
↑
┌─────────┴─────────┐
│ 数据源与语义层 │
│ (指标仓库、数据连接) │
└───────────────────┘
这三层形成一个完整的闭环:感知层持续捕获信号,思考层进行深度处理,行动层输出价值。同时,行动的结果又会反馈回感知层,形成持续优化的学习循环。
二、感知层:AI代理的“感官系统”
感知层的任务是让AI代理能够“看见”和“听见”业务世界的变化。它由四个核心模块组成:
2.1 实时数据监控
AI代理需要持续监控企业核心指标的变化。衡石的实时监控引擎基于流处理架构构建:
数据接入:通过Kafka或类似消息队列,实时接入业务系统的数据流
窗口计算:使用Flink等流处理框架,维护滑动窗口内的指标聚合
基线维护:为每个指标建立历史基线,包含趋势性、周期性等特征
监控引擎的性能指标:
单节点可监控10万+指标序列
端到端延迟控制在5秒以内
支持秒级、分钟级、小时级多粒度监控
2.2 智能异常检测
监控只是收集数据,真正的挑战是识别什么值得关注。衡石的异常检测模块采用集成算法策略:
算法一:统计方法(3-sigma、IQR)
计算历史数据的均值和标准差
将超出均值±3倍标准差的数据点标记为异常
适用于分布相对稳定的指标
算法二:时间序列分解(STL)
将时间序列分解为趋势项、季节项和残差项
在残差项上检测异常,排除周期性和趋势性波动
适用于有明显周期性的指标(如日周期、周周期)
算法三:机器学习模型(孤立森林)
对于分布复杂、无明显规律的指标,采用无监督学习
通过随机切割特征空间,识别容易被“孤立”的点
适用于高维度和复杂分布场景
算法四:预测偏差检测(Prophet)
先用Prophet模型预测指标当前值
如果实际值超出预测区间,则触发异常
适用于有较强趋势性和季节性的指标
集成策略:多种算法并行运行,采用加权投票机制决定是否触发异常。算法权重根据历史准确率动态调整。
2.3 上下文捕获
异常本身只是一个信号,要理解异常的意义,需要结合上下文。衡石的上下文捕获模块持续收集:
这些上下文信息会与异常信号一起,传递给思考层进行深度处理。
2.4 用户行为分析
除了数据监控,AI代理还需要理解用户的行为模式:
用户经常查看哪些指标?
在什么时间查看?
收到洞察后是否采取行动?
对哪些类型的预警反馈“有用”?
这些行为数据用于构建用户画像,指导后续的推送策略和个性化服务。
三、思考层:AI代理的“大脑”
感知层收集了原始信号,思考层的任务是理解这些信号并决定如何应对。这是整个架构中最复杂的部分。
3.1 意图理解
当感知层触发一个异常事件,或用户主动发起提问时,思考层首先需要理解“发生了什么”。衡石的意图理解引擎基于大语言模型构建,但针对分析场景进行了专门优化:
实体识别:从问题或事件中提取关键实体
意图分类:判断用户或事件想要什么
查询类:“销售额是多少?”
对比类:“和上个月比怎么样?”
归因类:“为什么下降?”
预测类:“下个月会怎样?”
行动类:“需要做什么?”
歧义消解:处理业务术语的模糊性
3.2 任务规划
理解意图后,代理需要规划如何实现目标。衡石的任务规划引擎采用分层规划策略:
宏观规划:将复杂任务分解为多个子任务
例如:“分析销售额下降原因”分解为:
计算总销售额变化
多维度下钻(区域、产品、渠道)
相关性分析(广告、库存、竞品)
因果推断
生成报告
微观规划:为每个子任务选择最优执行路径
哪些计算可以下推到数据库?
哪些需要调用算法模型?
哪些可以复用缓存结果?
动态调整:根据中间结果实时调整后续规划
3.3 归因分析
归因是思考层的核心能力。衡石的归因分析引擎综合运用多种技术:
多维度下钻
相关性分析
计算异常指标与其他指标的相关性系数
识别高度相关的指标,提供潜在原因的线索
因果推断
同期群分析
3.4 决策生成
归因分析得出“为什么”,决策生成回答“怎么办”。衡石的决策引擎基于规则和模型的混合架构:
规则库:预定义业务规则
“当库存低于安全线时,建议补货”
“当客户活跃度连续下降时,创建跟进任务”
规则可由业务人员通过可视化界面配置
模型推荐:基于历史数据训练推荐模型
学习过去类似场景下哪些行动最有效
输出带有置信度的行动建议
风险评估:评估每个行动的风险等级
高风险行动(如大额折扣)需人工确认
低风险行动(如发送提醒)可自动执行
最终输出的决策包包含:
洞察结论(发生了什么、为什么)
行动建议(建议做什么)
置信度评分(有多确信)
可解释信息(为什么这样建议)
四、行动层:AI代理的“手脚”
思考完成后,代理需要将决策转化为行动。行动层负责执行和反馈。
4.1 洞察推送
洞察不是简单的文本,而是结构化、可交互的智能卡片:
{
"insight_id": "insight_12345",
"title": "客户流失风险预警",
"summary": "客户'XX科技'近30天登录次数下降80%,3个售后工单未解决",
"severity": "high",
"confidence": 0.92,
"details": {
"metrics": ["登录次数", "工单数"],
"dimensions": ["时间", "客户"],
"attribution": "主要原因是近期系统故障导致用户体验下降"
},
"actions": [
{
"label": "创建跟进任务",
"type": "api_call",
"endpoint": "/api/tasks",
"payload": {
"type": "customer_followup",
"customer_id": "c12345",
"priority": "high"
}
},
{
"label": "查看详细分析",
"type": "navigation",
"url": "/analytics/customer-risk/c12345"
}
]
}
推送支持多通道:
产品内通知:在工作台、看板顶部展示
即时通讯:通过钉钉、飞书、企业微信推送
邮件:生成每日/每周洞察摘要
移动推送:通过App推送重要预警
4.2 行动执行
当用户点击行动按钮,或系统触发自动执行时,行动层负责:
API调用:调用SaaS产品的业务API
创建任务、发送通知、调整配置
支持动态参数注入(如自动填充客户ID)
工作流触发:启动预定义的业务流程
指令下发:向其他系统发送指令
4.3 反馈收集
行动的终点不是执行,而是学习。衡石的反馈收集模块记录:
用户是否查看了洞察?(隐式反馈)
是否点击了行动按钮?(采纳率)
行动后的结果如何?(效果评估)
用户是否标记了“有用”/“无用”?(显式反馈)
这些反馈被持续用于优化:
异常检测阈值调整(减少误报)
归因算法权重优化(提高准确率)
推送时机和渠道优化(提升转化率)
个性化模型更新(更好地理解用户偏好)
五、闭环的生命周期:从感知到学习的完整循环
让我们通过一个具体案例,追踪AI代理完成一次“感知-思考-行动”闭环的全过程:
场景:某电商SaaS平台的AI代理监控着数千家店铺的销售数据。
第一阶段:感知
凌晨2点,感知层监测到店铺A的“支付转化率”在1小时内从5%骤降到2%
异常检测模块确认:偏离基线超过4倍标准差,置信度95%
上下文捕获:今天是工作日,没有大促活动,店铺A是重点客户
事件触发,传递给思考层
第二阶段:思考
意图理解:这是一个“异常归因”任务
任务规划:
计算总转化率变化
按渠道、设备、地域等多维度下钻
相关性分析(广告、流量、竞品)
生成归因报告
归因分析:
决策生成:
洞察结论:转化率下降由广告系统故障导致
行动建议:切换广告渠道、发送预警通知
置信度:92%
第三阶段:行动
第四阶段:反馈
系统记录:洞察被查看、行动被采纳
1小时后,监测到转化率逐步恢复,记录“行动有效”
将这次事件的完整数据存入案例库,用于未来优化模型
六、技术挑战与解决方案
6.1 实时性与深度分析的平衡
挑战:实时监控需要低延迟(秒级),但深度归因需要复杂计算(可能需要秒到分钟级)。
解决方案:
分层计算:实时层做轻量级检测,只识别“可能异常”;深度层异步计算,结果缓存复用
流批一体:采用Lambda架构,流处理保障实时性,批处理保障深度分析
优先级调度:重要客户的请求优先处理,普通请求排队执行
6.2 误报控制
挑战:过于敏感的异常检测会产生大量误报,导致用户“狼来了”效应。
解决方案:
6.3 因果推断的准确性
挑战:相关性不等于因果性,错误归因可能误导决策。
解决方案:
6.4 大规模并发
挑战:当监控的指标达到百万级,同时有大量用户在线时,系统可能过载。
解决方案:
七、未来演进:从单代理到多代理协同
衡石对Agentic BI的下一阶段想象是多代理协同:
专业分工:不再是一个通用代理,而是多个专业代理协同工作
销售代理:专注于客户、商机、业绩数据
客服代理:专注于工单、满意度、服务时效
供应链代理:专注于库存、采购、物流
跨域协作:代理之间可以相互对话
自主决策:对于确定性高、风险可控的场景,代理可以自主执行
这种多代理协同架构,将让AI代理从“单个助手”进化为“整个团队”,为企业提供全方位的智能决策支持。
八、结语:从“工具”到“伙伴”的进化
Agentic BI的“感知-思考-行动”闭环,标志着数据分析从“工具”到“伙伴”的进化。它不再是等待指令的被动工具,而是能够主动观察、深入思考、果断行动的智能伙伴。
对于SaaS厂商而言,这意味着可以为自己的产品注入真正的“智能基因”。当产品中的AI代理能够7×24小时守护客户的业务,在问题发生的第一时间发现、分析、解决,产品就从“记录工具”进化为“决策伙伴”,从“功能平台”进化为“智能环境”。
衡石科技的Agentic BI架构,正在让这一愿景成为现实。通过构建完整的“感知-思考-行动”闭环,衡石让AI代理真正具备了“看见”业务、“理解”问题、“推动”行动的能力。而这,正是智能分析的下一个十年。