我正在使用weka.classifiers.bayes.HMM尝试对我的一些数据进行分类,但似乎无法找到我的ARFF文件应该如何显示的任何示例......文档对我来说并不是很清楚。在Weka中使用HMM
所以我明白,HMMs需要时间序列数据,我的问题是如何在我的数据集中表示?我是否应该在每条特征线前添加另一个“数字”索引?例如,这里是我的特征线的3(总共有十万10秒,但都遵循这种格式):
2,2.217950,2.235440,0.031252,2.224833,2.301141,0.093227,1.940765,1.973835,0.064434,1 2,2.216870,2.235608,0.035570,2.217950,2.235440,0.031252,2.023161,2.531513,0.623939,1 2,2.216577,2.246109,0.045806,2.216870,2.235608,0.035570,2.497010,2.529199,0.050049,1
每一行都包含几个能量读数,它们都按顺序排列:第一行出现在第一行,第二行在第二行读数后出现1秒,第三行,1秒等。
如何使用HMM在韦卡训练这套球衣? (是的,我知道我需要一个单独的测试数据集,这也是一个时间序列)
谢谢!
我忘了提及我需要5个状态:1,2,3,4,5。他们应该以一定的概率从一个到另一个。例如,如果当前时隙处于状态3,则更可能进入状态2和4,而不是1和5. 状态位于最后一行(作为示例在下面编辑): 2, 2.217950,2.235440,0.031252,2.224833,2.301141,0.093227,1.940765,1.973835,0.064434,1.2.216870,2.235608,0.035570,2.217950,2.235440,0.031252,2.023161,2.531513,0.623939,2,2.216577,2.246109,0.045806,2.216870, 2.235608,0.035570,2.497010,2.529199,0.050049,3 – stellarowl12