零售行业商品竞争力提升的数据探索

大数据
本文将分享零售行业商品开发的基本流程,以及盒马为提升商品竞争力在数据建设方面所做的探索与实践。

一、全链路商品竞争力提升的整体思路

1. 零售行业从消费者需求到商品开发经营的全链路强依赖数据

图片

从整个零售的视角来看,一个商品从市场调研、消费者调研,到引入、迭代产品,再到商品计划、供应链把控,以及后续的线上运营和财务考核,这一整个链路是非常长的。在传统的零售企业中,由于数字化程度不足,整个链路流转过程往往仅存在于经手人员的经验之中。然而,由于盒马的业务从创立之初就是一个完全数字化的业务,因此有机会打破这些瓶颈。

2. 提升商品竞争力的核心思路:全链路+全周期

图片

在数据层面,主要聚焦于两大方向:

  • 从商品流转的角度出发,致力于提升销售毛利,同时降低商品成本;
  • 在商品从引入到退换的整个生命周期中,力求提升运营效率。

商品作为零售业务的核心,涉及到销售、采购以及两者之间的流通环节。

3. 数据资产服务能力建设与商品全链路的应用场景互相促进

图片

进一步细化到数据操作层面,我们发现品类规划、商品引入、定价、退换等一系列过程基本上依赖于两大要素:

  • 数据资产和数据能力的丰富程度
  • 业务链路中场景应用的广度

这两者相互促进,丰富的场景应用能够促进数据资产的建设,而完善的数据资产又能提升场景应用的效果。

4. 支撑提升商品竞争力的数据能力体系

图片

总结来说,盒马的数据资产和数据服务的积累主要体现在三个方面:

  • 首先是 1 个平台,盒马已建立起一个集商品数据管理与服务于一体的平台,旨在统一全链路数据标签和指标口径,并提供统一的数据服务能力,以提升商品各个环节的数据使用效率。
  • 其次是 2 幅画像,即商品画像和消费者画像。
  • 最后是 N 项能力,我们面临包括批发市场数据、竞争的市场调研等在内的数据,需要拥有处理这些异构数据的能力,以确保我们能够有效地整合和分析来自不同来源的数据。

二、商品数据资产服务建设与典型应用场景

1. 2 幅画像

(1)商品标签画像

图片

商品标签包含六类,首先是基础属性,包括名称、品种、口味、净含量等;第二类是零售或电商场景下用户对商品的触达,包括浏览、点击、下单等;其余四类分别为基于经营特征做的分层、商品标签刻画、受众分析,以及品类这一层的属性。

图片

从深层视角来看,可以将标签分为三个层次:

  • 首先是基础数据标签,主要依赖于统计,如打点,这些构成了底层基础标签的统计。
  • 其上是规则分层标签,基于运营规则对商品进行分层,以确保数据符合业务预期。
  • 最后是应用场景标签,通过基于规则和数据的消费者洞察,旨在构建消费者心智。

(2)用户标签画像

图片

用户标签种类繁多,在此仅选取与商品运营密切相关的部分进行阐述,主要包括用户的基础属性、行为统计和场景偏好。此外,仅仅拥有单个用户的标签属性是不够的。从商品创新或运营的角度来看,我们需要进一步关注用户群体的表现特征,因为基于人群的运营才是业务操作中的关键抓手。

(3)用户标签与商品标签深入参与到业务链路的各类消费场景

图片

无论是用户标签还是商品标签,其建设过程主要包括三个方面:

  • 基于统计和大数据计算;
  • 通过归因规则平台,基于原始数据,使业务能够迅速构建相应规则;
  • 利用挖掘和算法模型进行建模。

在阿里巴巴,我们使用阿里云上的平台来实现整个建模过程,并将数据存储在资产中心或其他管理平台,如 CRM 相关工具上,以供下游分析场景、数据产品、算法以及直接对接的业务系统使用。

2. N 项能力

(1)面向多源信息的加工能力

图片

关于之前提到的 N 项能力,主要包括以下几个方面:

  • 首先,基础模型的使用,这涉及关键词词库、图像处理以及大模型(如通义千问等)。
  • 其次,商品能力主要体现在三大块:商品属性挖掘、类目预测以及同品识别。
    商品属性数据挖掘主要关注商品的净含量等关键信息。在数据多元化的背景下,这些信息往往呈现不规范的状态。例如,在商品价格比较时,如山姆销售 1000 克的产品,在盒马仅销售 200 克,如何归一化比较这些不同规格的产品数据也是一个挑战。
    类目预测旨在将不同来源的数据置于同一类目维度下,进行刻画和分析。
    同品识别:对于标品来说,在行业内的统一编码。但对于生鲜等非标品,由于缺乏统一的行业标准,如何识别同品类商品是一个重要问题。
  • 数据能力包括数据产品建设,在后文中将会做详细阐述。

(2)加工处理能力原子化

图片

当前所面对的数据源不仅限于可控的数据源,还包括基地的 PR 市场、线上线下的市场调研数据等。为实现对多元数据的灵活处理,提出了两个基本要求:

  • 数据输出标准化,确保无论数据来源如何,都有统一的输入标准;
  • 能力原子化,即,将各种能力进行模块化处理,以便在不同场景下灵活编排和适配。

3. 场景应用

接下来,将简要介绍几个有趣的应用场景。

(1)称损优化

对于零售企业而言,其采购的商品多为大包装或批量采购,例如,从批发市场购进上海青时,可能一次性购入十吨或二十吨。这些原材料进入盒马的加工中心后,根据商品的质量和克重进行分包处理,以满足门店销售的 200 克或 400 克等规格的包装需求。

在加工过程中,称损是一个不可忽视的环节。当原材料经过初次称重并剔除次品后,进入包装流程。再次称重时往往会发现,即使是规范化的操作,也很难保证每个商品的实际重量与其标准规格完全一致。因此,称重环节必然会产生损耗。

以有机娃娃菜为例,销售给消费者的标准重量是 400 克。然而,在实际操作中,每个包装完成后的商品重量并不相同,有的可能低于标准重量,有的则超过。对于低于标准重量的商品,盒马会采取退差策略,通过退还差价的方式确保消费者权益不受损害。

但对于超过标准重量的商品,如 410 克,消费者虽然支付了 400 克的价格,却获得了更多的商品。这部分额外的成本,实际上是由盒马承担的,构成了真实的利润损耗。据估计,盒马每年在此类损耗上的支出近一个亿。

为了优化这一流程,我们借助数据科学的方法对加工中心出产的商品进行了深入分析。我们发现,这些商品大致可以分为几类:

  • 单果类商品(如大白菜)通常一个或半个为单位;
  • 少果类商品(如苹果)则可能是两个装或四个装;对于像上海青这样的蔬菜,包装中往往包含多个单位;
  • 多果类,如车厘子,其果径大小也会影响包装数量。

基于这些分类,我们收集了过去三个月内每个加工中心出产的商品的实际重量数据,并进行了刻画分析。根据分析结果,我们制定了三种优化策略:

  • 调整产品规格,当大部分商品的实际规格超过其标准规格时(如超过 20 克),建议提高产品规格并相应调整价格;
  • 设定合理的重量波动范围,确保商品的实际重量在标准重量的一定范围内波动,以满足商业性限制;
  • 对部分商品进行拆分处理,以更好地满足市场需求和成本控制要求。

以 1.5kg 大白菜为例,该产品的实际重量分布存在两个峰值。在这种情况下,根据模型建议,将此产品拆分为两个不同规格进行销售,分别为1.8kg 和 2.7kg,并设定不同的价格,从而实现了整体损耗的大幅下降。

(2)价格策略

图片

近年来,低价一直是零售领域的核心竞争力之一。对于零售企业,特别是盒马这样的自营零售企业而言,确定价格并非仅基于单品成本,而是需要从品类和商品价格视角出发。

这涉及对品类结构的分析,如常规品类、结构品类、高潜品类以及优势品类等,并考虑这些品类内的价格敏感度。基于这些分析,企业可以确定在哪些品类中强调价格竞争力,而在哪些品类中追求盈利。以酱油为例,传统加工酱油是竞争力强的品类,但进口酱油的毛利润就比较高,这个品类在市面零售企业里是比较少见的。

在确定了品类定位后,接下来是商品定位。对于高度竞争的品类,其中的商品价格策略需要仔细制定。有些商品可能作为引流品,以极低的价格指数吸引消费者;有些则可能保持行业平均价格水平;而另一些则可能定价较高,以实现盈利。

图片

在分类完成后,企业需进行市场比价或竞争价格分析。

从基础数据出发,圈选部分商品,利用规格标准化和属性抽取等能力,实现盒马商品与市场商品的可比性。随后,进行价格归一化处理,考虑商品规格差异、品质差异等因素,确保价格比较的准确性。

在整个过程中,还需根据应用场景和业务需求,制定不同的比价策略,并对价格调整后的效果进行追踪和反馈。

图片

以盒马“省心价”为例,该标签的生成目前已实现完全自动化。该过程包括商品获取、匹配、规划等步骤。

当商品价格指数低于预设阈值时,系统将其视为对消费者最具竞争力或最优的价格,并自动为商品打上“省心价”标签。这些标签随后会同步至 APP 和线下门店,以便消费者了解。

(3)场景标签

图片

关于面向场景的商品标签生成,我将以两个具体案例为例进行说明,即商品的“轻食”标签和“零添加”标签。

选择这两个案例是因为当前社会对健康问题的关注度日益提高,特别是在饮料领域,无糖、低糖和零添加饮料的占比逐渐增加。盒马也在此方面做了一些尝试。盒马的商品量庞大,故场景标签生成无法依赖人工处理,其整个流程已实现自动化。

首先,我们获取每个商品的背标图,这些图片包含了商品的原材料、配料表及营养成分等必要信息。

随后,通过 OCR 处理技术,将这些图片信息转化为文本信息。

接着,对这些原始资料进行加工,包括规则化处理和模型加工,以生成相应的标签,如“低卡”、“低脂”,此外也可以识别商品是否含有特定原材料,生成“有”、“无”的标签。

图片

商品标签除了在 APP 上的展示外,这些标签还具有另一个重要作用,即基于商品发现关注该商品的人群。例如,通过“轻食”标签,我们可以区分出重视此属性的消费者群体和非重视群体。进一步加工和分析这些人群数据后,可将其应用于搜索优化、推荐优化等业务场景中。

(4)品类创新

图片

从品类创新的视角来看,品类创新实际上依赖于品类的高度分层和优化。在整个分层过程中,打标并非基于简单的统计,具有一定的复杂性。具体而言,目前将标签分为四类。

首先,事实类标签,即直接反映商品属性的标签;

其次,基于管理规则的标签,这些标签体现了从管理思想或产销管理角度出发对商品的管理诉求,例如,对战略品,我们会特别关注其供应链保障和库存优化。对于常规品类而言,其管理重点可能在于保证不缺货。

进一步地,从规则计算的角度来看,针对消费品,我们采用了 SABC 等分类方法,并结合时令、本地特色、自由品牌等要素,以突出商品特色或竞争力,从而吸引消费者注意。

图片

具体到某一类商品,如 S 品,我们可以理解为市场上的主要热销商品,其年销售额可达数十亿。

在业务表现分类上,从管理视角和用户视角出发,对商品所打的标签存在差异。例如,最近正当季的春菜、荔枝,从管理视角看,可能被视为战略品,而在用户视角下,它可能仅被视为时令商品。这体现了消费者对商品认知与企业管理策略之间的差异。

图片

在商品创新方面,盒马有小龙虾月饼这种特色产品。

这些产品的研发过程首先涉及在特定类目下找到决策因子,这些因子通过模型挖掘得出,反映了不同消费者群体对商品属性的偏好。例如,对于饮料而言,年轻人可能更关注口味,而中年人则更注重健康属性。

基于这些不同的属性,我们会进行排列组合,并在销售端进行市场验证。

这一过程中,盒马利用其自有的加工中心和加工能力,实现从基础属性组合的商品探索到最终销售验证的快速流程。

(5)供应商协同

图片

在讨论商品的竞争力和质量时,不可忽视供应商的重要性。在现代零售环境中,供应商管理的转变尤为显著。

传统企业往往通过博弈手段对供应商施加压力,以获取更高的收益。然而,盒马更注重与供应商的协同合作。对于自营零售企业而言,商品建设是一个长期的过程,我们期望与供应商建立长期稳定的合作关系,而非仅仅追求短期利益。同时,由于零售市场的激烈竞争,零售商对供应商并没有完全的控制权。

图片

在供应商协同方面,盒马通过销量预测的方式,提前半个月到七天将预测结果同步给供应商,以促进其进行备货操作。这一做法旨在确保商品齐全,避免送货延误或库存缺失的情况。

同时,对供应商而言,这也为他们提供了规划补货链路的依据,以避免因零售商减产导致的库存积压。

此外,产地供应商还会将预期的产量同步给盒马,以促进盒马进行价格调整。例如,当榴莲等高价商品的产地预计产量将下降时,盒马可以根据这些信息提前进行价格调整或备货,以应对市场变化。

4. 1 个平台

我们已经讨论了画像标签、相关能力以及场景应用。接下来,将简要介绍开头提及的“1 个平台”的概念。

图片

这个平台,即盒马的数据资产中心,主要有两个核心职责:

第一,数据管理。在数据领域,数据治理一直是各行业面临的重要挑战。传统企业通常会设立数据治理岗位,而在互联网企业,这一职责通常由数据团队承担。数据管理涵盖了表指标、标签以及一些运维工作,同时也涉及数据开放后的权限控制。

第二,数据服务统一与可视化。在数据使用端,除了消费者外,业务方和外部合作伙伴在使用数据时,常遇到两大问题:

  • 不清楚数据所在位置或使用方法;
  • 在数据使用过程中,由于途径多样,难以做出选择。

图片

关于数据服务提供,主要方向有两个:在线接口和离线数据使用。

在线数据主要服务于业务报表搭建和业务系统直接使用,可通过数据资产中心直接生成相应接口。

经过长时间探索,在统一指标时,我们意识到离线数据是有必要的。因为离线数据仓库中的数据通常直接开放给他人使用,为了更好地控制数据加工逻辑,我们要求使用数据的用户通过资产中心自动生成离线视图或表,从而与线上的数据加工逻辑相隔离。

图片

在数据管理领域,我们将其划分为三个主要部分:指标、维度以及指标实例的管理。

传统方法中过于技术化的算子、原子指标和派生指标等概念,对于业务来说理解成本高,因此我们在实践中进行了简化。在底层管理和业务实现过程中屏蔽了算子、原子指标等,仅定义指标。

目前管理的指标总数达 8000 个,其中核心指标约 800 个。在数据使用方面,我们面对的是大量指标实例的筛选使用问题。尽管指标包含指标说明字段,但指标名称存在相似性。为了提升效率,我们为业务部门提供了专门的空间,将 8000 个指标精简至 1000 个或者几百个,便于业务部门在小范围内进行筛选。

对于维度管理,由于其技术性较强,我们将其完全划归技术团队进行管理。当维度与指标交叉产生大量指标实例时,利用数据资产中心这一平台来进行统一处理。

该平台的主要职责是通过工具提升整体使用效率,包括开发效率、使用效率等。在当前数据资产治理流行的背景下,一些好的数据平台用不起来,可能是没有考虑到平台使用也需要长期的数据积累与数据体系的建设。我们注重工具的上手效率,以确保产品的广泛适用性。

图片

数据资产中心的引入还带来了工作流程的显著变化。以报表为例,整个数据从需求对接到产出的流程涉及多个角色和环节,如业务方、业务 PD、数据 PD、开发等。在引入该平台前,数据团队的主要工作放在了中间层数据开发和报表搭建上。

图片

在引入该平台后,整个工作方式都发生了改变。无论是业务方、产品设计师(PD)还是资产负责人(即特定业务领域的 PD),其工作重心都转移到了围绕数据资产上,而非单纯满足业务需求。

如今,业务 PD 或业务成员可以通过该平台搜索所需的数据资产,若存在则直接使用,若不存在则可提出需求。对于数据开发人员而言,他们的工作也发生了转变,从过去每次为特定需求开发散点状报表,变为开发、补充指标或指标实例,从而提高了工作的可量化性和效率。

此外,由于该工具支持无代码的数据集和报表搭建,报表搭建的工作被更多地转移给了业务层。出乎意料的是,业务团队非常愿意参与这项工作,因为这些工具提高了他们的工作效率。


三、面向数据智能化大趋势下的探索思考

1. 数据团队从数据化走向智能化的趋势是长期的、共识的

图片

关于智能化方面的考虑,实际上早在 2021 年的云栖大会上,盒马就分享了一个观点,即业务的数字化、数据资产化、数据服务化以及最终智能化的发展过程,并非仅因大模型的出现而备受关注,而是业界长期以来的关注焦点。这一演进过程预示着数据未来的智能化方向。

2. 数据领域内部的智能化探索思路:人与 “智能体” 长期并存

图片

在当前的探索阶段,我们已进行了几方面的初步尝试。我们有一个大的前提假设,当前的智能化还达不到替换数据团队的程度,就像电动车和燃油车之间还存在一个混动的中间过程,这一阶段将长期存在。

首先,关于智能体的存在,我们将其视为与技术选项同等级别的角色,当前重点在于各类建模。其核心目标是提高技术人员的工作效率,并期待未来能形成统一的规范、标准和建模理论,以支持面向智能体的需求。

其次,高效交互方面,我们注意到大模型在 NLP 处理上的卓越表现,特别是在语音语义理解方面的高水平,这为数据获取提供了新的可能性。

第三,在复杂数据分析和诊断方面,我们意识到传统方法存在局限性,即依赖于预定义的规则关系,缺乏拓展性。因此,我们计划结合资产管理的经验和当下对语义理解的提升,探索新的分析方法。

最后,在数据治理方面,我们认识到解决业务问题的复杂性,特别是如何将非数字知识融入决策中,这对智能化提出了巨大挑战。因此,我们考虑在数据治理领域内,先解决自身的一些棘手问题,如数据打点、数据成本等,这些问题的解决将有助于推动智能化的进一步发展。

3. 数据智能化需要长期探索,过程中的思考和建议

图片

这里分享一些关于智能化的思考:

首先,在智能化的道路上要追求确定性。当前,市场上有许多宣称能解决各类问题的产品,但仔细审视后,这些产品往往只是展示了一些成功的案例,距离实现真正的确定性目标还有很大的距离。当我们声称机器能解决某个问题时,必须明确认识到,这个问题与实际应用场景中的问题之间可能存在巨大的差异。

因此,在提及智能化或相关主题时,不应仅仅停留在表面,而应当深入探索其背后的技术和应用场景。当前的大模型,就像几年前的深度学习技术,虽然在某些领域取得了显著进展,但同样需要时间来验证其在实际应用中的效果。

对于数据领域的专家而言,更应该关注数据本身,思考如何利用这些技术来解决我们自身的问题。例如,考虑更新和优化数据建模方法,以适应新时代的需求。

最后,智能化的探索是一个长期且需要持续投入的过程。虽然这个过程可能充满挑战,但通过大家的共同努力,将会推动智能化的不断进步。

责任编辑:姜华 来源: DataFunTalk
相关推荐

2023-10-08 15:33:22

云计算零售行业

2015-09-23 17:08:07

大数据百度

2014-04-30 15:20:06

数据挖掘

2011-09-13 18:43:25

2017-06-20 10:57:08

新零售

2020-04-03 10:32:39

数字化转型零售行业CIO

2014-05-09 15:35:51

CRM营销

2013-06-28 15:35:41

华为eSpace统一通信华为

2009-07-27 11:32:20

宁波银行运维管理摩卡软件

2022-09-14 08:01:47

安全漏洞

2021-06-01 14:55:35

纷享销客高科行业SaaS

2011-11-30 17:19:06

微软

2021-11-04 08:00:00

人工智能机器学习技术

2023-05-11 08:00:30

2018-06-05 11:20:33

大数据人工智能零售

2019-06-18 14:12:07

Hadoop大数据数据库

2012-11-28 11:52:29

浪潮一体机大数据

2021-05-28 14:47:06

人工智能零售行业AI

2009-03-11 09:38:58

阅读学习方法学习乐趣
点赞
收藏

51CTO技术栈公众号