2009-10-20 60 views
7

我想制作一个推荐系统,我的意思是一个算法,查看用户发布的偏好和/或评论,然后为它们提供建议,类似于netflix或亚马逊使用的。我可以在哪里了解推荐系统?

学习如何写这样的东西有什么好的资源?我应该从哪里开始?

回答

5

查看Netflix Prize及其discussion forum上的维基百科页面。此外,有些相关的2009 GitHub Contest是许多不同推荐引擎上的完整源代码的很好的来源。显然还有Wikipedia page on the topic itself,它有一些体面的链接。

如果你开始写自己的,你会想使用语料库。我实际上建议使用Netflix Prize's data set。只需将数据集分成两部分即可。在第一块上训练,并在第二块上评分算法。

附录:这种事的一个有点相关的和可怕的应用是predicting demographic information:用户的性别,年龄,家庭收入,智商,性取向等你也许可以做到大部分这些属性与Netflix的奖数据集具有相当高的准确度。幸运的是everyone in that dataset is just a number

+0

有什么可怕的呢?营销人员会根据您的浏览器,IP和来自HTTP标头的其他信息来尝试预测您的时间。这不是实际的信息,只是“知情的刻板印象”(条件贝叶斯)。 – isomorphismes 2011-03-14 03:39:06

+1

因为数据被表示为“匿名”,但实际上不是?如果用户从未选择加入他们的共享数据,这一点尤其糟糕。 – 2011-03-14 20:07:17

+0

我可能不完全明白你的意思。你是否说匿名被违反,因为我可以准确猜出用户2871875的人口特征? – isomorphismes 2011-04-15 09:13:43

相关问题