2012-04-20 64 views
2

我想弄清楚一种方式,我可以代表一个Facebook用户作为一个载体。我决定将用户的不同属性/参数堆叠成一个大的矢量(即年龄是一个大小为100的矢量,其中100是您可以拥有的最大年龄,如果您可以说50,则前50个值该矢量就像温度计一样)。我无法想出一种方法来将脸谱利益作为一种媒介来表达,他们是一组词汇,代表所有词汇的空间是巨大的,我无法像一袋文字那样寻找模型或相似的东西。有谁知道我应该怎么做?我仍然对此感到陌生,任何参考都将不胜感激。机器学习如何使用Facebook用户的兴趣来作出决定

在希望投票回答这个问题的情况下,让我知道它有什么问题,以便我可以改进措辞和上下文。

谢谢

回答

2

“正确”的方法取决于你的学习算法是什么以及决策问题是什么。

尽管如此,将年龄表示为单个数字特征而不是100个指标特征通常会更好。这样,学习算法不需要学习这百种功能之间的关系(它已经被烘焙),而且问题的尺寸减少了99个,这会使一切变得更好。

为了模拟的利益,你可能要开始用语言模型的极高立体袋,然后用各种选项之一来减少维度: