2013-03-23 97 views
0

我有这种形式的数据:最合适的AI参数加权?

[(v1, A1, B1), (v2, A2, B2), (v3, A3, B3), ...] 

v小号对应于数据元素和A S和B s至数值表征v秒。

查看此数据的人可以查看它,并根据AB值查看哪个元组似乎是最佳“匹配”。我想要一种AI的形式,我可以通过选择这些元组中的一个作为最佳来训练,并且将调整给予AB的权重。

基本上,每个元组表示一个近似值。 A表示错误,B表示每个近似的复杂度。我希望通过分配不同的权重来在错误和复杂性之间做出妥协。我想用不同的近似值进行几次试验,并选择我认为看起来最好的试验,并让AI相应地调整权重。

+1

你想“匹配”什么?这听起来像你想要某种贝叶斯机器学习,但没有额外的细节我不能真正帮助太多。请提供一些关于您的问题的背景知识,以及您尝试实现的目标。 – 2013-03-23 04:27:13

+0

啊,好的。基本上,每个元组表示一个近似值。“A”表示一个错误,“B”表示每个近似的复杂度。我希望通过分配不同的权重来在错误和复杂性之间做出妥协。我想用不同的近似值进行几次试验,并选择我认为看起来最好的试验,并让AI相应地调整权重。 – Hypercube 2013-03-23 04:41:23

回答

1

您所描述的内容也被称为model selection问题,这是机器学习和统计中经常遇到的问题。你基本上有一些模型可以通过一些好的度量来适合你的数据(通常用误差或对数似然度量),这些模型有一些复杂度度量(通常是模型中的参数数量)。你想选择最合适的模型,并惩罚其复杂性,因为这可能是overfitting的标志。

通常情况下,过度拟合会影响你的程度是由数据大小决定的。但也有一些措施,明确允许您权衡模型健康和复杂性:

请根据您的数据,上述可促使模型模型选择的数据。因此,这通常使用validation set and then evaluated on a test set来完成。

我不知道你的算法是否能解决这个问题是一个很好的方法。通常它取决于你的数据和一定程度的直觉。在我看来,你描述的元机器学习技术可能不会太可靠。最好先从一些更原则和更简单的想法开始。

+0

这不是我的意思,但是没有正确解释是我的错。谢谢 :) – Hypercube 2013-03-29 00:32:47