译者 | 布加迪
审校 | 孙淑娟
在线市场eBay在其机器学习模型中加入了额外的购买信号,比如“添加到关注列表”、“出价”和“添加到购物车”,根据搜索的初始商品提高所推荐的广告列表具有的相关性。Chen Xue在最近的这篇文章中作了非常详细的介绍。
eBay的促销列表标准(PLS)是面向卖家的收费选项。使用PLSIM这个选项,eBay的推荐引擎会推荐类似潜在买家刚点击的某个商品的赞助商品。PLSIM按CPA模式支付(卖家仅在销售达成时向eBay付费),因此这对于创建最有效的模式来促销最佳列表非常有动力。这往往对卖家、买家和eBay都卓有成效。
PLSIM旅程如下所示:
1. 用户搜索商品。
2. 用户点击来自搜索的结果——>登录查看商品(VI)页面,以查看列出的商品(eBay称之为种子商品)。
3. 用户向下滚动VI页面,可在PLSIM中看到推荐的商品。
4. 用户点击来自PLSIM的商品,执行操作(观看、添加到购物车和立即购买等),或者查看另一组新的推荐商品。
从机器学习的角度来看,PLSIM旅程如下:
- 检索与种子商品最密切相关的子集候选促销列表标准(“查全集”)。
- 运用经过训练的机器学习排序器,根据购买的可能性对查全集中的商品列表进行排序。
- 根据广告费率对商品列表重新排序,以便将通过促销实现的卖家售卖速度与推荐相关性作一番权衡。
排序模型
排序模型基于以下历史数据:
- 推荐商品的数据
- 与种子商品相似的推荐商品
- 上下文(国家和产品类别)
- 用户个性化功能
eBay使用梯度提升树,对于特定的种子商品而言,该梯度提升树根据商品的相对购买概率对商品进行排序。
从二元反馈到多重相关反馈
在过去,购买概率依赖二元购买数据。如果是与种子商品一起购买的,它就是“相关”的,不然就是“不相关”的。这是一种失败的方法,不过有几个主要的方面可加以优化:
- 漏报:由于用户通常只从推荐列表中购买一件商品,因此在购买没有进行的情况下,好的推荐可能被视为不好的推荐,从而导致误报。
- 购买很少:与其他用户事件相比,训练具有足够购买数量和多样性的模型来预测正向类正变得颇具挑战性。
- 遗漏数据:从点击到添加到购物车,众多用户操作揭示了大量用户信息,揭示了可能出现的结果。
综上所述,eBay工程师除了考虑初始点击以及如何将它们添加到排序模型外,还考虑以下用户操作:
- 立即购买(仅适用于Buy-It-Now即BIN列表)
- 添加到购物车(仅适用于BIN列表)
- 出价(仅适用于最佳出价列表)
- 叫价(仅适用于拍卖列表)
- 添加到关注列表(适用于 BIN、最佳出价或拍卖列表)
用户界面示例
多重相关反馈的相关级别
eBay现在知道购买极具相关性,因此需要添加其他操作,但新的问题是:这些操作在相关性等级内处于什么位置?
下图说明了eBay如何对剩余的可能操作进行排序——“出价”、“立即购买”、“添加到关注列表”和“添加到购物车”。
在种子商品的历史训练数据中,每个潜在商品都按以下等级标记为相关性级别。
标记的结果是,在训练期间,排序器对排序错误的购买实行的惩罚比排序错误的“立即购买”更严重,往下依此类推。
多重相关反馈的样本权重
梯度提升树支持多个标签来捕获一系列相关性,但没有直接的方法来实现相关性的大小。
eBay不得不迭代运行测试,直至得出使模型工作的数字。研究人员加入了额外的权重(名为“样本权重”),这些权重被馈送到成对损失函数中。他们优化了超参数调整工作,并运行了25次迭代,然后得出最佳的样本权重——“添加到关注列表”(6)、“添加到购物车”(15)、“出价”(38)、“立即购买”(8)和“购买”(15)。如果没有样本权重,新模型的表现会较差。有了样本权重,新模型的表现优于二元模型。
他们尝试仅添加点击作为额外的相关反馈,并运用经过调整的超参数“Purchase”样本权重150。下面还显示了离线结果,其中“BOWC”代表“立即购买”、“出价”、“添加到关注列表”和“添加到购物车”这些操作。购买排序反映了所购商品的平均排序。越小越好。
结论
训练的模型总共有超过2000个实例。A/B测试分两个阶段进行。第一阶段仅包括额外的选择标签,在eBay移动应用程序上的购买数量显示增加2.97%,广告收入显示增加2.66%,这被认为足够成功,可以将模型投入到全球生产环境。
第二阶段在模型中加入了更多操作,比如“添加到关注列表”、“添加到购物车”、“出价”和“立即购买”,A/B测试显示出更好的客户参与度(比如更多的点击和BWC)。
原文标题:EBay Uses Machine Learning to Refine Promoted Listings,作者:Jessica Wachtel