本文转载自微信公众号「大数据DT」,作者刘强。转载本文请联系大数据DT公众号。
01 基于内容的推荐
推荐系统是通过技术手段将标的物与人关联起来,标的物包含很多属性,用户通过与标的物的交互会产生行为日志,通过这些行为日志可以挖掘出衡量用户对标的物偏好的标签(将标的物的属性赋予喜欢它的用户,让用户具备这个标签),通过这些偏好标签为用户做推荐就是基于内容的推荐算法。
拿视频推荐来说,视频有标题、国别、年代、演职员、标签等信息,用户以前看过某类视频,就代表用户对这些视频有兴趣,比如用户偏好恐怖、科幻类电影,这样用户的电影偏好就被打上了恐怖、科幻的标签,我们就可以根据这些兴趣特征为用户推荐恐怖、科幻类电影。
02 协同过滤
用户在产品上的交互行为为用户留下了标记,我们可以利用“物以类聚、人以群分”的朴素思想来为用户提供个性化推荐。
具体来说,“人以群分”就是找到与用户兴趣相同的用户(有过类似的行为),将这些兴趣相同的用户浏览过的标的物推荐给用户,这就是基于用户的协同过滤算法。
“物以类聚”就是如果有很多用户都对某两个标的物有相似的偏好,说明这两个标的物是“相似”的,我们可以通过推荐与用户喜欢过的标的物相似的标的物这种方式为用户提供个性化推荐,这就是基于物品的协同过滤推荐算法。
图1-2简单说明了这两类协同过滤算法。
▲图1-2 两类协同过滤推荐算法
03 基于模型的推荐
一般来说,可基于用户行为记录、用户相关信息(年龄、性别、地域和消费习惯等)及标的物相关信息来构建算法模型,预测用户对物品的偏好,常用的算法包括logistic回归、矩阵分解、分解机等。
随着深度学习技术的发展,目前有很多深度学习相关的算法落地到了推荐系统上,并产生了很好的效果。
04 基于社交关系的推荐
我们在日常生活中经常为别人或者要求别人给我们推荐书籍、 餐厅、电影等,这种推荐方式往往效果较好,大家也更容易接受。
微信“看一看”模块中的“在看”就是通过将你的微信好友看过的文章展示给你来实现推荐的,张小龙在2019年微信8周年的微信公开课上说到,“在看”比“看一看”模块中的“精选”效果好很多,而“精选”就是通过算法来实现的推荐。
在这些推荐算法中,基于内容的推荐和协同过滤推荐是最古老、最常用的推荐算法,实现相对简单,效果也很不错,在工业界得到了大规模的应用。
关于作者:刘强,硕士学历,09年毕业于中国科学技术大学数学系。有12年大数据与推荐系统实践经验,精通企业级推荐系统的构建。从零到一打造过千万级DAU视频APP的推荐系统,推荐系统产生的流量占全APP流量的30%。在过去的3年内为多家中小型互联网公司(流媒体、在线教育、跨境电商等)提供技术咨询,帮助他们从零到一构建推荐系统。
本文摘编自《构建企业级推荐系统》,经出版方授权发布。