1

我正在评估推荐引擎使用精度和召回。到目前为止,我已经使用4个不同的数据集评估了系统,精度值分别为0.833,0.857,0.857和0.769。相同数据集的召回值分别为0.448,0.875,0.5504和0.512。如何使用这些结果来评估待测试的推荐引擎?我是否应该在相同的数据集上应用标准CF并检查值,或者是否有任何标准的精度和召回基准来对推荐系统进行分类?例如,如果精度是x并且召回是y,那么这个算法应该被丢弃还是被接受?精确和召回评估推荐引擎

回答