我们用一张表格展示推荐系统向用户推荐的列表与用户真实的访问项目,如下:
用户 | 真实值 | 推荐列表 | 是否命中 |
---|---|---|---|
A | 12 | 3,10,15,12,17 | 是(1) |
B | 3 | 20,15,18,14,30 | 否(0) |
C | 5 | 2,5,7,8,15 | 是(1) |
D | 14 | 56,14,25,12,19 | 是(1) |
E | 20 | 21,24,36,54,45 | 否(0) |
评价指标的来源是根据TKDE-2019中的一篇论文使用的方法:
1. 命中率 HR(Hits Ratio)
意义:关心用户想要的,我有没有推荐到,强调预测的“准确性”
参数说明:
N: 用户的总数量
hits(i) = 0 or 1,命中为1,没命中为0
2. 归一化折损累计增益(Normalized Discounted Cumulative Gain,NDCG)
意义:关心找到的这些项目,是否放在用户更显眼的位置里,即强调“顺序性“
参数说明:
N: 用户的总数量
pi: 第i个用户的真实访问值在推荐列表的位置,若推荐列表不存在该值,则pi→∞
减函数,所以越靠前NDCG越大
3. 平均倒数排名(Mean Reciprocal Rank,MRR)
意义:关心找到的这些项目,是否放在用户更显眼的位置里,即强调“顺序性“
参数说明:
N: 用户的总数量
pi: 第i个用户的真实访问值在推荐列表的位置,若推荐列表不存在该值,则pi→∞
减函数,所以越靠前MRR越大
MRR和NDCG类似
1 | import math |