近期,衡石成功举办了 HENGSHI SENSE 4.2 线上分享会,分享会上衡石 CEO 刘诚忠及衡石首席数据科学家陈家耀围绕整个数据分析产业的发展、行业趋势和衡石的创新进行深度探讨和分享。上期推文我们分享了衡石 CEO 刘诚忠带来的《Powered by BI PaaS - 让商业分析即刻上线》。
本期推文一起来看看衡石首席数据科学家陈家耀带来的《数据分析平民化的挑战与应对》分享。
传统数据分析流程
“数据分析平民化”一直是数据分析行业的共同愿景,可以说最近10年 BI 行业的小伙伴们都在为这个愿景努力,现在还在推进的过程中。为什么这件事情这么难,我们先看看传统的分析流程是怎么样的。
在传统的流程中, IT 人员负责的 scope 非常广,包括数据接入、数仓建模、开发报表,业务人员只是在高度凝练之后的报表层进行分析。而在现代流程中,工程师则只需负责数据接入,以及在数据湖或数仓中简单的清理和整合工作,之后的数据建模、数据准备等工作由业务人员自助完成。这样在整个分析流程里面,很多环节不再是一个需求方与开发方分离,需要牵扯大量跨部门沟通协作成本的过程。从而大大提升了分析的敏捷性和效率,某种程度上实现了分析的平民化。
第四阶段是我们美好的期望,但目前看距离落地实现还需要较长的时间,一方面分析自动化的复杂度完全不亚于自动驾驶,另一方面分析场景和分析数据的私密性,将导致训练数据的获取难度比自动驾驶要高很多。因此,预计在很长一段时间内,我们都将一直处于第三阶段,在这个阶段由分析人员和 BI 平台共同配合来完成对开发工程师的补位,这就要求一方面BI平台不断提供更友好的智能辅助建模工具,另一方面分析师需要提升优化意识,掌握这些智能工具的使用。
上图是一个分析普及后数据误用的真实案例:某公司产品团队上线了一个新产品,在 AB 测试期间发现该产品对收入的贡献非常好,向老板建议尽快发布,但是运营团队周报却提到最近两周运营数据下降剧烈,老板无法决策,只好让分析师花了两周的时间排查原因,发现运营团队分析时一个收入指标口径有问题。此时已经了导致该产品的发布延期。
衡石作为一家专注于赋能全行业的 SaaS / ISV 敏捷构建数据分析和 BI 能力的标准化软件产品厂商,在近期发布的 HENGSHI SENSE 4.2新版本中,针对于前面探讨的问题也做出了更多的优化和提升:
赋能数据科学家:HENGSHI SENSE 数据科学模块支持 Python,为数据科学家提供更好的语言来应对复杂的机器学习和高级分析需求。
更强大的数据源适配能力:HENGSHI SENSE 提供更强大的数据源适配能力帮助客户接入更多的数据。如支持原生 MangoDB,避免用户再从 MangoDB 往传统关系型数据库搬运数据,提升接入数据的效率;在 API 上对接了旺店通、石墨文档和企业微信,后续这些接口来源的数据可以便捷地接入 HENGSHI SENSE 与其他数据做关联分析。