基于LargeLanguageModel做推荐系统可以说是最近2年推荐系统领域最火的研究点。一方面,LLM的理解能力、在各个领域的广发应用,使其自然而然衍生了和推荐系统结合的研究方向;另一方面,传统的推荐模型优化已逐渐进入瓶颈,依然基于原有的建模思路进一步优化很难带来显著收益。因此无论是工业界还是学术界,都在LLM+推荐系统这个方向投入了很多的人力和资源。在2024年的推荐系统顶会工作中,大厂、学校合作的论文70%都是和大模型...
今天给大家介绍一篇北大、阿里联合发布的多模态大模型工作。这篇文章重点解决多图像输入的多模态大模型建模方法,融合粗粒度、细粒度信息,显著提升了多模态大模型在多图输入复杂场景中的效果。论文标题:MaVEn:AnEffectiveMultigranularityHybridVisualEncodingFrameworkforMultimodalLargeLanguageModel下载地址:https:arxiv.orgpdf2408.123211.研究背景现有的多模态大模型,大多数研究的都是一个图像输入的场景。而...
2024-12-11 11:46:38 342浏览 0点赞 0回复 0收藏
在大厂的推荐系统建模中,多场景建模是一个非常常见的业务场景。在很多app中,不同的场景都需要建模点击率、转化率等目标,以此进行排序给用户展现最感兴趣或最可能成交的候选。一种最简单的建模方法是每个场景分别训练一套模型,但是这种方式无法充分利用各个场景数据的共性信息,并且维护起来也非常麻烦。因此,如何有效联合多场景数据进行建模,或者进行多场景之间的知识迁移,是工业界推荐系统近两年研究的焦点。今天这篇文...
2024-12-04 12:03:12 388浏览 0点赞 0回复 0收藏
在现实世界中,观测到的时间序列通常表现出复杂多样的多尺度时间模式。尽管基于Transformer的方法在多尺度时间模式交互建模中取得了显著成功,但是两个关键问题限制了其在时间序列预测中的进一步发展。一方面,单个的时间点包含的语义信息较少,利用attention建模pairwise交互会造成信息利用瓶颈。另一方面,时间模式中存在多种固有的时序变化,这些时序变化相互纠缠,为建模多尺度时间模式交互带来了较大的挑战。针对上述问题...
2024-11-26 14:55:02 831浏览 0点赞 0回复 0收藏
在这个系列里,圆圆会带大家梳理2024年时间序列预测领域的经典工作,涉及多个优化方向。在这一节里,会为大家整体介绍2024年的时间序列一些具有突破性进展的领域。后续章节将持续在知识星球中更新,深入解读和串联这些领域的相关工作。1.时间序列基础模型2024年是时间序列预测与大模型深度结合的元年,涌现了很多时间序列基础模型和大模型中建模方法在时间序列预测的应用。一方面,今年出现了很多类型的时间序列基础模型,希望...
2024-11-19 14:33:29 850浏览 0点赞 0回复 0收藏
这篇文章给大家介绍一下北邮在NeurIPS2024中发表的一篇时间序列预测工作,重点研究了如果有效利用时间戳特征提升时序预测效果,相关方法可以嵌入到现有的各类SOTA时序预测模型中。论文标题:RethinkingthePowerofTimestampsforRobustTimeSeriesForecasting:AGlobalLocalFusionPerspective下载地址:https:arxiv.orgpdf2409.186961.研究背景现有的时间序列预测方法大多依赖于数值型的历史数据,并且假设这些数据的分布是相对稳定...
2024-11-13 14:25:29 698浏览 0点赞 0回复 0收藏
今天给大家介绍一篇南京大学、阿里巴巴联合发表的多模态模型建模方法WINGS,解决基于LLM的多模态模型在进行跨模态建模时的灾难遗忘问题。论文标题:WINGS:LearningMultimodalLLMswithoutTextonlyForgetting下载地址:https:arxiv.orgpdf2406.034961.研究背景随着人工智能技术的进步,多模态大型语言模型(MLLMs)作为大型语言模型(LLMs)的扩展,已经在视觉相关的描述生成、理解、推理等方面展现出惊人的性能。这些模...
2024-11-06 14:21:02 586浏览 0点赞 0回复 0收藏
今天给大家介绍一篇清华大学发表于NIPS2024中的大模型时间序列预测工作AutoTimes,使用大模型进行自回归形式的时间序列预测,并结合InContextLearning提升预测效果。论文标题:AutoTimes:AutoregressiveTimeSeriesForecastersviaLargeLanguageModels下载地址:https:arxiv.orgpdf2402.023701.背景大模型在时间序列预测中的应用已经有了一些研究工作。之前的大模型时序预测,主要讲大模型当成一个表征抽取器,将时间序列...
2024-10-31 14:21:50 1066浏览 0点赞 0回复 0收藏
多任务学习是推荐系统中非常常见的一个问题。推荐系统中,经常要对多个目标进行预测,比如点击率、转化率、观看时长等等。将这些任务联合学习,希望通过不同的监督信息,互相增强各自目标的拟合能力。但是同时,不同目标之间又不一定是正向关系,可能存在负向迁移问题,存在跷跷板现象。因此,如何最好的发挥多任务学习的作用,达到各个任务联合最优,一直是一个推荐系统领域的核心研究问题。这篇文章就给大家汇总一下,推荐...
2024-10-29 11:57:24 325浏览 0点赞 0回复 0收藏
今天给大家介绍一篇港中文、上海AILab等机构联合发表的CLIP优化工作,构建了基于多专家网络的MoE模型,实现更细粒度的视觉表征器训练,提升下游多模态大模型论文标题:CLIPMOE:TOWARDSBUILDINGMIXTUREOFEXPERTSFORCLIPWITHDIVERSIFIEDMULTIPLETUPCYCLING下载地址:https:arxiv.orgpdf2409.19291v21.背景基于CLIP的图文对比学习预训练是构建多模态大模型的一个核心基础模块。通过图片和文本的对比学习过程,训练图片和文...
2024-10-24 15:21:43 758浏览 0点赞 0回复 0收藏
今天给大家介绍一篇华东师范大学联合丹麦奥尔堡大学和松鼠AI发布的时间序列模型统一评测基准FoundTS,这是一个针对时间序列预测基础模型的基准测评框架,旨在利用不同领域和特征的数据集对不同的时间序列预测基础模型进行全面、公平的测评。该论文在统一评测结果的基础上,分析了现有时序预测基础模型的优缺点,并为基础模型的提升提出一些可行的方向。论文标题:FOUNDTS:COMPREHENSIVEANDUNIFIEDBENCHMARKINGOFFOUNDATIONMODEL...
2024-10-22 14:41:01 750浏览 0点赞 0回复 0收藏
今天这篇文章给大家介绍几篇KDD2024中,大厂在推荐系统领域的优化工作,论文来自爱彼迎、腾讯、快手、美团等公司,设计多目标建模、多样性、搜索意图建模、rankingloss等问题。1.爱彼迎:多目标建模和模型蒸馏论文标题:MultiobjectiveLearningtoRankbyModelDistillation下载地址:https:arxiv.orgpdf2407.07181多目标建模转换成模型蒸馏问题。多目标的场景要求最小化一个目标的预测误差,同时其他目标的预估误差在一个约束内。...
2024-10-18 14:32:46 742浏览 0点赞 0回复 0收藏
今天给大家介绍一篇清华大学的时间序列预测最新工作,提出了统一的Transformer时序预测模型,能同时处理单变量和多变量时序预测,并将时序预测的上下文长度首次扩充到千级别。论文标题:TIMERXL:LONGCONTEXTTRANSFORMERSFORUNIFIEDTIMESERIESFORECASTING下载地址:https:arxiv.orgpdf2410.04803v11.背景构建类似NLP领域的统一大模型是时序预测领域近期研究的焦点。虽然前序已经涌现很多工作,但是这些建模方法只能处理...
2024-10-16 15:44:59 735浏览 0点赞 0回复 0收藏
今天给大家介绍一篇时空预测最新模型PredFormer,由上海交大等多所高校发表,采用纯Transformer模型结构,在多个数据集中取得SOTA效果。1.背景时空预测学习是一个拥有广泛应用场景的领域,比如天气预测,交通流预测,降水预测,自动驾驶,人体运动预测等。提起时空预测,不得不提到经典模型ConvLSTM和最经典的benchmarkmovingmnist,在ConvLSTM时代,对于MovingMNIST的预测存在肉眼可见的伪影和预测误差。而在最新模型PredForme...
2024-10-12 14:29:23 1238浏览 0点赞 0回复 0收藏
这篇文章给大家介绍一下阿里发表的多模态大模型工作mPLUGOwl,共2篇文章,建立在前序图像表征对齐预训练大语言模型的思路,提出了不同的参数训练方式、多模态解耦映射等优化方法,在多项任务取得了SOTA效果。相关论文:mPLUGOwlLanguageModelswithMultimodalitymPLUGOwl2:RevolutionizingMultimodalLargeLanguageModelwithModalityCollaboration1.核心思路多模态大模型希望构建一个能同时处理文本、图像等不同模态信息的数据,...
2024-10-10 14:48:48 560浏览 0点赞 0回复 0收藏
时间序列预测建模中,非平稳性或distributionshift一直是一个建模难点。非平稳性指的是时间序列的统计量,如均值、方差随时间发生变化,导致数据分布随着时间发生漂移,造成了模型训练和拟合的难度。今天给大家介绍一下最近一段时间提出的2种解决时间序列非平稳性问题的方法。这两种方法分别从多粒度的角度和频域的角度进行可逆归一化,实现了不错的效果提升。1.基础可逆归一化方法可逆归一化最基础的方法来自REVERSIBLEINSTANC...
2024-10-08 14:31:05 1100浏览 0点赞 0回复 0收藏
今天给大家介绍一篇普林斯顿大学提出的时间序列大模型工作,是首个基于MoE的百万级别参数时间序列大模型,将时序大模型参数量扩展到2.4billion的水平,在多个数据集上取得了显著优于其他时间序列大模型的效果。论文标题:TIMEMOE:BILLIONSCALETIMESERIESFOUNDATIONMODELSWITHMIXTUREOFEXPERTS下载地址:https:arxiv.orgpdf2409.16040v11、背景时间序列大模型是目前的一个研究热点,很多工作都利用大量的时间序列数据训练专属于...
2024-09-29 15:24:29 899浏览 0点赞 0回复 0收藏
在CTR预估中,主流都采用特征embedding+MLP的方式,其中特征非常关键。然而对于相同的特征,在不同的样本中,表征是相同的,这种方式输入到下游模型,会限制模型的表达能力。为了解决这个问题,CTR预估领域提出了一系列相关工作,被称为特征增强模块。特征增强模块根据不同的样本,对embedding层的输出结果进行一次矫正,以适应不同样本的特征表示,提升模型的表达能力。最近,复旦大学和微软亚研院联合发布了一篇特征增强工作...
2024-09-25 12:27:21 540浏览 0点赞 0回复 0收藏
时间序列建模中很多种类型的结构可以选择,比如Transformer、CNN、RNN,以及最近被验证有效的MLP、Mamba等结构。然而,不同模型都有特定的潜在优势和劣势。因此,现在越来越多的时序预测模型优化工作,采用了多模型组合的建模方式。今天这篇文章,就给大家介绍一下多模型组合建模的核心思路,以及几篇近期发表的多模型组合时序预测工作,在一个模型中同时使用不同类型的模型结构,实现各个结构之间的优势互补。1.早期模型组合建...
2024-09-23 09:56:47 744浏览 0点赞 0回复 0收藏
1.长周期时序预测核心问题长周期时间序列预测,指的是预测窗口较长一类时间序列预测问题。一般来说,预测长度在50个点以上,就可以认为是长周期时间序列预测问题。同时,预测长度的增加,会使得模型需要引入更长的历史序列,才能实现更好的预测。相比短周期时序预测,长周期时序预测主要面临的挑战有以下几个方面。长周期历史信息提取:相比短序列,长序列由于其样本点更多,对历史信息的提取也更加困难,模型容易随着输入历史...
2024-09-11 11:03:22 1360浏览 0点赞 0回复 0收藏