召回阶段负采样

前言

推荐系统的召回阶段有许多的负采样策略,网上很多文章也介绍了各种负采样策略的优缺点,但是看了很多感觉不同文章还是有很多出入,并且没有形成一个完整的体系,所以本文尝试对负采样进行一个系统的总结。

正样本

一般直接选择点击过的物品

负样本

简单负样本

全体物品随机采样

均匀抽样:对冷门物品不公平 - 正样本大多数是热门物品 - 如果均匀抽样产生负样本,则负样本大多是冷门物品(因为冷门物品占据了大多数) - 会让热门物品更热,冷门物品更冷

非均匀抽样:目的是打压热门物品 - 负样本的选取概率与热门程度(点击次数)相关 - 抽样概率正比于点击次数的 0.75 次方

Batch 内负样本

正在加载今日诗词....
欢迎关注我的其它发布渠道