为了适应当下数字化经营的市场环境,指标平台通过指标高效开发、提供灵活高性能指标服务,逐渐成为企业数据基础设施的重要组成部分。而随着大模型技术的日益迭代,在大模型加持下的指标平台与指标分析正迎来新一轮升级变革,为企业提供新的增量价值。
作为行业领先的指标平台提供商,数势科技的指标平台可赋能、加持与放大消费品牌的经营分析能力,从北极星指标到多实体标签的设计,能助力消费品牌管好用好数据资产。
数势科技通过分析大模型和指标平台的市场应用环境,发现存在一些不足之处。特别是在面对管理决策团队时,如何在已建好的各项指标基础上进行精细化取数分析成为一个挑战。传统的BI工具,如报表大屏,虽然能够满足一般性需求,但当管理决策团队提出个性化需求时,例如需要提取特定数字或寻找某地区销售额下降原因时,往往需要借助业务分析团队进行繁琐的工作。
此外,随着高层管理团队和业务团队对数据的日益增长的需求,数据团队不得不应对日益增多的需求。许多重复性的指标需要不断开发,这无疑会导致企业计算资源的浪费,同时也会使存储空间超负荷。在字段加工报表较多时,可能存在数据口径相同但分析员和管理人员不清楚应该参考哪个字段或以哪一个为准的情况,这会成为他们面临的日常困扰。
为了应对以上痛点、难点问题,数势科技采用了基于指标+大模型的多模态交互方式。这种方式使得分析人员和管理者更容易理解大模型的设计意图和扩展功能,从而实现了更为高效的企业数据分析和决策制定。这一创新让数据真正做到了大众化、普及化,标志着企业智能决策迈向了一个新的里程碑。
针对一些关键困难点,如语义对齐的实现、多任务复杂性的确定、数据计算性能的需求,数势科技给出了基于大模型的指标分析解决方案。
首先,关于语义如何对齐的问题,数势科技实施了一种指标字典,其优势在于能以业务语言及研发语言为基础对每个指标进行定义。例如,业务语言用来定义指标的业务含义是什么,而研发语言表明指标的口径描述是什么,包括该指标提出的部门,需求相关人员,以及开发人员等方面的信息。大模型基于指标平台对业务和技术语言及其他相关口径的录入,更加准确地理解用户的问题所对应的确切指标,因此,数仓表中的结构化数据更适合大模型来提取数据或进行查询等。
其次,关于多任务复杂性的确定问题,包括跨任务协调以及任务间的依赖性,以及当用户提出查询时,如何将查询进行拆解。这部分工作是基于ReAct框架、知识库和技能池,组成了核心的Agent。实际应用到行业或领域时,需考虑技能池如何构建,例如报表生成、结论总结、归因洞察等能力。具体规划上,尝试采用COT(思维链)和TOT(思维树)等方式进行规划。此外,数势科技还会微调大模型进一步加强用户Query解析成API参数的能力等。
最后,关于数据计算性能的需求问题,数势科技基于指标平台有着非常强大的计算引擎——HME(HyperMetricsEngine)。HME的原理是主要依靠底层数据进行加工,通过数据虚拟化和预计算的方式,在用户查询时它会知道你在该场景下哪个字段是最为常用的,然后会将这些字段自动预处理并作为缓存。如此一来,用户在下次查询时,这个指标无需再次开始加工,而是通过缓存的方式加快查询结果的呈现速度。
数势科技指标+大模型的多模态交互方式带来了新的场景,并将这种场景走向实际落地,帮助企业解决现实环境中更为复杂的问题,提升企业的数字化决策能力,推动企业数字化升级。截至目前,基于大模型的数势指标平台已率先在多个客户场景中落地,涉及零售、汽车和金融等行业。