我有一个产品,让我们说一本书。现在我想要检索与此产品相似的k个产品。我怎样才能用Mahout做到这一点?如何使用Mahout获得k个类似的产品?
产品存储在MySQL数据库中,所以我会使用JDBCDataModel。 为了计算相似性,我更喜欢LogLikelihoodTest。
但我应该选择哪个推荐人?似乎所有的推荐人都是设计的
我有一个产品,让我们说一本书。现在我想要检索与此产品相似的k个产品。我怎样才能用Mahout做到这一点?如何使用Mahout获得k个类似的产品?
产品存储在MySQL数据库中,所以我会使用JDBCDataModel。 为了计算相似性,我更喜欢LogLikelihoodTest。
但我应该选择哪个推荐人?似乎所有的推荐人都是设计的
我想在这里猜这个问题。你有用户项目数据,用户是真实的人,项目是书籍。您正在使用LogLikelihoodSimilarity
作为推荐人的基础,无论是基于用户还是基于项目。
如果你只是想要最相似的物品,你不需要推荐人。只需使用LogLikelihoodSimilarity
(ItemSimilarity
)计算与所有其他项目的相似度并采取最相似的项目。实际上看看TopItems
这个类,它甚至为你做了这个逻辑。
设计...?完成这个想法,我敢肯定我可以回答。 – 2012-01-09 18:38:32
对不起,它是在说“所有推荐人都是为了与用户数据一起使用而设计的”。 – brainfck 2012-01-09 22:42:16