我想读的IRStatisticsImpl
数据,但有一些问题:如何解释象夫IRStatisticsImpl数据
我的结果是:
IRStatisticsImpl[precision:0.04285714285714287,recall:0.04275534441805227,fallOut:0.0018668022652391654,nDCG:0.04447353132522083,reach:0.997624703087886]
没有意思,我只拿到4%的好建议(精确)和大约相同水平的不良推荐(召回)?
最好的数字应该是什么样子 - 精度为1.0,回忆为0.0?
你能告诉我,'fallOut'和'nDCG'的数字应该如何?它们应该是1.0还是0.0? – ulkas 2013-05-20 07:35:42
顾名思义,fallOut是“从所有可用的非相关文档中检索到的非相关文档的比例:”http://en.wikipedia.org/wiki/Information_retrieval#Fall-out据我所知,它应该尽可能低,但它也很容易得到0%,所以你可能会评估你的域名。 – gpicchiarelli 2013-05-20 08:32:34
关于nDCG,它是DCG的标准化版本,意思是“折扣累积收益”。确切地说,在这里看看http://en.wikipedia.org/wiki/Discounted_cumulative_gain – gpicchiarelli 2013-05-20 08:42:15