技术博客
衡石技术博客是一个围绕数据分析和BI领域提供丰富实用的技术文章、案例分析和实战经验的博客平台。

免费试用

全部

帮助手册

API文档

课堂中心

技术博客

白皮书

架构深度解析:衡石科技如何凭借云原生与存算分离架构重塑BI性能边界
作者:HENGSHI 时间:2025-11-20

在数据量指数级增长的时代,传统商业智能(BI)平台的架构瓶颈日益凸显——数据膨胀带来的查询延迟、有限的扩展性以及高昂的运维成本。衡石科技之所以能脱颖而出,其根基在于一套从第一天起就为大规模、多租户、实时分析场景设计的云原生与存算分离的现代化技术架构。本文将从技术底层深入剖析,揭示其高性能背后的秘密。

一、传统BI架构的瓶颈与云原生的必然性

传统BI架构多采用单体式或紧耦合设计,计算与存储节点绑定。这种架构存在天然缺陷:

  • 扩展困难:数据量增长时,只能进行昂贵的垂直扩展(Scale-Up)。

  • 资源浪费:计算与存储资源无法独立伸缩,导致利用率低下。

  • 多租户隔离性差:在SaaS或大型企业环境下,不同部门/客户的工作负载容易相互干扰。

衡石科技的架构选择直击这些痛点,全面拥抱以Kubernetes为核心的云原生技术栈,实现了彻底的微服务化与存算分离。

二、衡石科技云原生架构的技术栈分解

衡石的平台架构可以清晰地分为四层:

  1. 统一接入层:

    1. 技术实现:基于Envoy或类似技术的API网关,负责流量路由、认证、限流与SSL终止。它为所有数据查询和平台操作提供了统一的、安全的入口。

  2. 无状态计算层:

    1. 技术实现:运行在Kubernetes Pod中的多个微服务集群。

    2. 查询引擎:核心是高度优化的分布式SQL查询引擎。它接收来自网关的查询请求,生成并优化执行计划。该引擎本身是无状态的,可以随时根据查询负载进行弹性伸缩。

    3. 计算服务:除了查询引擎,还包括语义层服务、AI模型服务(用于智能预警和NLQ)、任务调度服务等。它们都独立部署和扩展。

  3. 统一数据访问层:

    • 云数据仓库:Snowflake, BigQuery, Redshift, ClickHouse(作为加速引擎)。

    • 数据湖:Apache Hudi, Iceberg, Delta Lake(通过Spark或Presto/Trino)。

    • 传统数据库:MySQL, PostgreSQL, Oracle等。

    1. 技术实现:这是实现“存算分离”的关键。衡石抽象了一个统一的数据访问接口,通过连接器 模式,可以无缝对接各种底层数据源,而计算引擎无需感知数据的物理位置。

    2. 支持的数据源:

  4. 持久化存储层:

    • 指标存储:自主研发的、针对指标数据优化的高性能列式存储引擎,用于存放预计算的聚合结果和常用指标,实现亚秒级响应。

    • 元数据存储:使用可靠的分布式数据库(如TiDB或云厂商的Aurora/RDS)存放数据模型、权限、查询历史等元数据。

    1. 技术实现:衡石自身不强制持久化存储原始业务数据,而是将计算推向数据所在的位置。对于需要加速和管理的场景,它利用:

三、存算分离架构带来的核心优势

  1. 极致的弹性伸缩:

    1. 计算独立伸缩:在业务高峰时段,Kubernetes可以自动扩容查询引擎的Pod实例数量,以应对高并发查询;空闲时则缩容以节省成本。

    2. 存储独立伸缩:底层数据仓库或数据湖的存储能力可以独立于计算进行扩展。企业可以为计算和存储分别选择最合适、最具性价比的云服务。

  2. 显著的成本优化:

    1. 避免了为应对峰值流量而长期维持高配计算资源所带来的浪费。实现了真正的按需付费。

  3. 强大的多租户与数据隔离:

    1. 在Kubernetes Namespace和网络策略的配合下,可以为不同客户或部门创建逻辑上完全隔离的“租户”。结合统一的认证授权体系(如RBAC),确保了数据安全与性能隔离。

  4. 无缝的异构数据源集成:

    1. 统一数据访问层使得用户可以在一个查询中关联分析位于Snowflake的销售数据和位于S3数据湖的日志数据,技术复杂性对业务用户透明。

四、技术挑战与衡石的解决方案

实现此架构并非易事,衡石克服了诸多技术挑战:

  • 跨数据源查询优化:衡石的查询引擎内置了跨源查询优化器,能够智能地将计算下推至各个数据源,并仅在必要时在引擎内部进行数据合并,最大限度地减少网络传输。

  • 数据一致性:通过分布式事务(对于元数据)和最终一致性模型(对于部分缓存数据)的有机结合,保障了用户体验的一致性。

  • 运维复杂性:通过成熟的Operator和自动化运维工具链,降低了Kubernetes集群本身的管理负担。

结语

衡石科技的云原生与存算分离架构,不仅仅是技术选型的胜利,更是其对未来数据分析范式深刻理解的体现。它将BI平台从一个单纯的“工具”提升为一个弹性的、可扩展的、面向未来的“数据分析操作系统”,为企业驾驭海量数据、实现实时决策提供了坚实的技术基石。

衡石注册banner.jpg


相关资讯
热门标签
衡石科技 衡石BI BI ChatBI BI数据分析 BI PaaS平台 Agentic BI 企业级BI AI+BI BI工具 HENGSHI SENSE 嵌入式BI BI Agent AI 指标平台 BI平台 ISV/SAAS 厂商 BI PaaS HENGSHI SENSE 6.0 AI Copilot Data Agent ChatBI解决方案 AI Agent 指标管理 BI系统 指标中台 对话式BI 传统BI 一站式BI分析平台 Chat2Metrics HENGSHI SENSE 6.1 deepseek BI可视化 零代码BI 数据中台 BI报表 应用模版市场 嵌入式分析 可视化报表 多租户 Deep Seek 大数据模型BI AI数据 语义层 交互式BI BI软件 BI解决方案 NL2SQL 生态伙伴 智能问数 OA crm NL2DSL 衡石ChatBot Agentic Analytics ChatBot HQL Gen AI 生成式BI 衡石API 自助式BI 多源异构数据 爱分析 问答式BI SDK React SDK

丰富的资源 完整的生态

邀您成为衡石伙伴