4

我正在做一个交通流量预测,我可以预测一个地方有很重或很轻的交通。我已将每个流量分类为1-5个,其中1个是最轻的流量,另外5个是最重的流量。关于adaboost算法

我遇到了这个网站http://www.waset.org/journals/waset/v25/v25-36.pdf,AdaBoost算法,我真的很难学习这个算法。 特别在S是集合((xi,yi),i=(1,2,…,m))的部分。其中Y={-1,+1}。什么是x,y和常数LL的价值是多少?

有人可以解释我这个算法吗? :)

回答

4
S={(x1,y1),...,(xm,ym)}

:每(x,y)对是用于训练(或测试)样品的分类:

  • x =它们描述该特定样品,其中列出amount of cars on the roadday of the week示例值的特征,等
  • y =特定x,所述的标签而你的情况可以是1, 2, 3, 4 or 5

Table 1在纸显示他们使用,即x特征:DAYTIMEINTDETLINKPOSGREDISVOLOCC。该表的最后一列显示标签(y),它们设置为1-1(即,yesno)。表中的每一行都是1个样本。

L是AdaBoost训练弱学习者的回合数量(文中使用Random Forests作为弱分类器)。如果你设置L1那么AdaBoost将运行1轮,只有1个弱分类器将被训练,这将会有不好的结果。对L执行多个不同值的实验以找到最佳值(即,当AdaBoost收敛或开始过度拟合时)。