鸿蒙开发者社区

公众号矩阵

移动端

视频课免费课排行榜短视频直播课软考学堂

全部课程软考信创认证华为认证厂商认证 IT技术 PMP项目管理免费题库

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

AI.x社区

登录/注册
51CTO

中国优质的IT技术网站

51CTO博客

专业IT技术创作平台

51CTO学堂

IT职业在线教育平台

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比

发布于 2024-9-25 12:27

浏览

0收藏

在CTR预估中，主流都采用特征embedding+MLP的方式，其中特征非常关键。然而对于相同的特征，在不同的样本中，表征是相同的，这种方式输入到下游模型，会限制模型的表达能力。

为了解决这个问题，CTR预估领域提出了一系列相关工作，被称为特征增强模块。特征增强模块根据不同的样本，对embedding层的输出结果进行一次矫正，以适应不同样本的特征表示，提升模型的表达能力。

最近，复旦大学和微软亚研院联合发布了一篇特征增强工作的总结，对比了不同特征增强模块实现方法的效果。下面给大家介绍一下几种特征增强模块的实现方法，以及本文进行的相关对比实验。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

论文标题：A Comprehensive Summarization and Evaluation of Feature Refinement Modules for CTR Prediction

下载地址：https://arxiv.org/pdf/2311.04625v1.pdf

1.特征增强建模思路

特征增强模块，旨在提升CTR预估模型中Embedding层的表达能力，实现相同特征在不同样本下的表征差异化。特征增强模块可以用下面这个统一公式表达，输入原始的Embedding，经过一个函数后，生成这个样本个性化的Embedding。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

这类方法的大致思路为，在得到初始的每个特征的embedding后，使用样本本身的表征，对特征embedding做一个变换，得到当前样本的个性化embedding。下面给大家介绍一些经典的特征增强模块建模方法。

2.特征增强经典方法

An Input-aware Factorization Machine for Sparse Prediction（IJCAI 2019）这篇文章在embedding层之后增加了一个reweight层，将样本初始embedding输入到一个MLP中得到一个表征样本的向量，使用softmax进行归一化。Softmax后的每个元素对应一个特征，代表这个特征的重要程度，使用这个softmax结果和每个对应特征的初始embedding相乘，实现样本粒度的特征embedding加权。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

FiBiNET: Combining Feature Importance and Bilinear feature Interaction for Click-Through Rate Prediction（RecSys 2019）也是类似的思路，为每个样本学习一个特征的个性化权重。整个过程分为squeeze、extraction、reweight三个步骤。在squeeze中，将每个特征embedding通过pooling得到一个其对应的统计标量。在extraction中，将这些标量输入到MLP中，得到每个特征的权重。最后，使用这个权重和每个特征embedding向量相乘，得到加权后的embedding结果，相当于在样本粒度做一个特征重要性筛选。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

A Dual Input-aware Factorization Machine for CTR Prediction（IJCAI 2020）和上一篇文章类似，也是利用self-attention对特征进行一层增强。整体分为vector-wise和bit-wise两个模块。Vector-wise将每个特征的embedding当成序列中的一个元素，输入到Transformer中得到融合后的特征表示；bit-wise部分使用多层MLP对原始特征进行映射。两部分的输入结果相加后，得到每个特征元素的权重，乘到对应的原始特征的每一位上，得到增强后的特征。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

GateNet: Gating-Enhanced Deep Network for Click-Through Rate Prediction（2020）利用每个特征的初始embedding过一个MLP和sigmoid函数生成其独立的特征权重分，同时也使用MLP对所有特征进行映射生成bit-wise的权重分，两者融合对输入特征进行加权。除了特征层外，在MLP的隐层，也利用类似的方法，对每个隐层的输入进行加权。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

Interpretable Click-Through Rate Prediction through Hierarchical Attention（WSDM 2020）也是利用self-attention实现特征的转换，但是增加了高阶特征的生成。这里面使用层次self-attention，每一层的self-attention以上一层sefl-attention的输出作为输入，每一层增加了一阶高阶特征组合，实现层次多阶特征提取。具体来说，每一层进行self-attention后，将生成的新特征矩阵经过softmax得到每个特征的权重，根据权重对原始特征加权新的特征，再和原始特征进行一次点积，实现增加一阶的特征交叉。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

ContextNet: A Click-Through Rate Prediction Framework Using Contextual information to Refine Feature Embedding（2021）也是类似的做法，使用一个MLP将所有特征映射成一个每个特征embedding尺寸的维度，对原始特征做一个缩放，文中针对每个特征使用了个性化的MLP参数。通过这种方式，利用样本中的其他特征作为上下位增强每个特征。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

Enhancing CTR Prediction with Context-Aware Feature Representation Learning（SIGIR 2022）采用了self-attention进行特征增强，对于一组输入特征，每个特征对于其他特征的影响程度是不同的，通过self-attention，对每个特征的embedding进行一次self-attention，实现样本内特征间的信息交互。除了特征间的交互，文中也利用MLP进行bit级别的信息交互。上述生成的新embedding，会通过一个gate网络，和原始的embedding进行融合，得到最终refine后的特征表示。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

3.实验效果

文中进行了各类特征增强方法的效果对比，整体结论为，在众多特征增强模块中，GFRL、FRNet-V、FRNetB 表现的最好，并且效果要优于其他的特征增强方法。

一文总结特征增强&个性化在CTR预估中的经典方法和效果对比-AI.x社区

本文转载自圆圆的算法笔记，作者： Fareise

标签

赞

收藏

回复

举报

回复

相关推荐

ICLR 2024 | UTS提出全新联邦推荐算法：从全面个性化过渡到加性个性化

laokugonggao • 4144浏览 • 0回复
一文回顾常见图像融合方法

angel • 5443浏览 • 0回复
AI生图可“量身定制”了，华为&清华联手打造个性化多模态生成方法PMG

Crystalcxt • 2820浏览 • 0回复
一文汇总：时序预测中的多频率建模方法

海因斯DK • 3739浏览 • 0回复
统一单ID和多ID个性化框架！阿里发布UniPortrait:质量和多样性超越现有方法

angel • 3247浏览 • 0回复
一文总结扩散模型（Diffusion Model）在时间序列中的应用

海因斯DK • 1.1w浏览 • 0回复
《自然》期刊发布最新科学报告：人工智能技术在个性化医疗中的创新与挑战

xuxiangda • 1.4w浏览 • 0回复
一文梳理Transformer在时间序列预测中的发展历程代表工作

海因斯DK • 7853浏览 • 0回复
突破个性化图像生成局限！MagicTailor：组件可控个性化图像生成创新框架！

angel • 3228浏览 • 0回复
一文读懂LLMs的幻觉问题和对策

数字化助推器 • 2914浏览 • 0回复
贾佳亚团队新作MagicMirror：生成身份一致且高质量个性化视频，效果惊艳！

angel • 2948浏览 • 0回复
面向统一的单、多主体个性化文生图框架！阿里通义发布AnyStory！

angel • 2271浏览 • 0回复
使用语义模型和场景感知NLP的个性化搜索优化以改进搜索结果

51CTO内容精选 • 3380浏览 • 0回复
个性化大语言模型：PPlug——让AI更懂你

AIGC前沿技术追踪 • 2440浏览 • 0回复
一文搞懂 DeepSeek 的蒸馏技术和案例实践

玄姐聊AGI • 7309浏览 • 0回复
一文读懂 RAG 中的 embedding model

鸿煊的学习笔记 • 3096浏览 • 0回复
探究PEPNet模型：多任务多领域推荐的个性化建模！

南夏的算法驿站 • 2836浏览 • 0回复
零阶优化的扩散模型个性化方法；合成图像检测；舞蹈动作音乐同步生成

AI研究前瞻 • 1761浏览 • 0回复
FlashFace: 具有高保真身份保存的人像个性化方法，效果超越InstantID，人脸定制化更逼真了！

AIGCStudio • 1762浏览 • 0回复

这个用户很懒，还没有个人简介

帖子

声望

粉丝

关注

最近发布

ICML'25 | 兼容不同数据源周期性差异的时间序列基础模型 2025-06-25 08:04:46发布
中科大&腾讯：通过提升各个专家网络差异性提升基于MoE的CTR预估效果 2025-06-25 07:49:53发布

热门推荐

从原理到调参，小白也能读懂的大模型微调LoRA，不懂线性代数也没问题 0回复

从播客到带娃，看老黄、纳德拉、奥特曼这些CEO 如何在生活中使用 AI 0回复

本命周！MiniMax M1有多猛？网友：仅用40k思考预算就干翻Gemini，实测：真·超DS！ 1回复

AI Agents开源工具栈全解析~ 0回复

我把DeepSeek微调参数扒光了，显存和性能优化的秘密都在这 0回复

上一篇：时序预测中的多类型模型组合建模方案

下一篇：普林斯顿大学提出首个基于MoE的稀疏时序预测大模型，参数量扩展到2.4billion

社区精华内容

目录

Copyright © 2005-2025 51CTO.COM 京ICP证060544版权所有未经许可请勿转载