推荐系统测评指标——计算DCG、IDCG以及nDCG的python代码-阿里云开发者社区

推荐系统测评指标——计算DCG、IDCG以及nDCG的python代码

2023-01-12 1275

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 推荐系统测评指标——计算DCG、IDCG以及nDCG的python代码

1. 公式

DCG：

其中， K是推荐列表的大小；

i 是指推荐列表中的第 i i i个推荐项；是指推荐项 i i i 是否被用户点击，若点击则为 1 1 1，否则为 0 0 0，在实际测试中，我们通常吧推荐列表中在测试集的推荐项视为被用户点击的推荐项，不在测试集中的推荐项视为未被用户点击的推荐项；

IDCG：

注意到IDCG的计算公式与DCG一致，区别在于IDCG是完美的DCG，也即 r i = 1 r_i=1 r

i =1的推荐项在推荐列表 K K K头部， r i = 0 r_i=0 r i =0的推荐项在推荐列表 K K K的末尾。

nDCG：

NDCG是归一化后的DCG

2. 代码

import numpy as np
def DCG(A, test_set):
    # ------ 计算 DCG ------ #
    dcg = 0
    for i in range(len(A)):
        # 给r_i赋值，若r_i在测试集中则为1，否则为0
        r_i = 0
        if A[i] in test_set:
            r_i = 1
        dcg += (2 ** r_i - 1) / np.log2((i + 1) + 1) # (i+1)是因为下标从0开始
    return dcg
def IDCG(A, test_set):
    # ------ 将在测试中的a排到前面去，然后再计算DCG ------ #
    A_temp_1 = [] # 临时A，用于存储r_i为1的a
    A_temp_0 = []  # 临时A，用于存储r_i为0的a
    for a in A:
        if a in test_set:
            # 若a在测试集中则追加到A_temp_1中
            A_temp_1.append(a)
        else:
            # 若a不在测试集中则追加到A_temp_0中
            A_temp_0.append(a)
    A_temp_1.extend(A_temp_0)
    idcg = DCG(A_temp_1, test_set)
    return idcg
def NDCG(A, test_set):
    dcg = DCG(A, test_set) # 计算DCG
    idcg = IDCG(A, test_set) # 计算IDCG
    if dcg == 0 or idcg == 0:
        ndcg = 0
    else:
        ndcg = dcg / idcg
    return ndcg
if __name__ == "__main__":
  # ------ 计算推荐列表A的NDCG ------ #
  # A：推荐列表，一维list，存储了推荐算法推荐出的推荐项的id
  # test_set：测试集，一维list，存储了测试集推荐项的id
    ndcg_A = NDCG(A, test_set)

推荐系统测评指标——计算DCG、IDCG以及nDCG的python代码

1. 公式

2. 代码

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

推荐系统测评指标——计算DCG、IDCG以及nDCG的python代码

1. 公式

2. 代码

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像