我想在这里有一些专家指导什么是我最好的方法来解决问题。我调查了一些机器学习,神经网络和类似的东西。我已经调查过weka,某种baesian解决方案.. R ..几个不同的东西。不过,我不确定如何真正开始。这是我的问题。最好的方法,我认为是一个机器学习问题
我拥有或将拥有大量活动......最终大约有100,000人左右。每个事件由几个(30-50)独立变量和1个我所关心的因变量组成。在确定因变量的值时,一些自变量比其他自变量更重要。而且,这些事件与时间有关。今天发生的事情比10年前发生的事情更重要。
我希望能够为事件提供某种学习引擎,并让它预测因变量。然后,知道该事件的因变量(以及之前发生的所有事件)的真实答案,我希望能够训练后续的猜测。一旦我了解了编程方向,我可以进行研究并弄清楚如何将我的想法转化为代码。但我的背景是并行编程,而不是这样的东西,所以我很乐意就此提供一些建议和指导。
谢谢!
编辑:这里有一些关于我试图解决的问题的更多细节:这是一个定价问题。假设我想要预测随机漫画书的价格。价格是我唯一关心的事情。但是有很多自变量是可以想到的。它是超人漫画,还是Hello Kitty漫画。多大了?什么情况?等等。经过一段时间的训练后,我希望能够提供关于我可能正在考虑的漫画书的信息,并让它为漫画书提供合理的预期价值。好。所以漫画书可能是一个虚假的例子。但你得到了一般想法。到目前为止,从答案中,我正在对支持向量机和朴素贝叶斯进行一些研究。感谢您的所有帮助。
我认为标签“分类”和“回归”是互斥的。它可以是“分类”,也可以是“回归”。它不能兼而有之。 – 2009-05-20 08:48:26