2

我正在使用weka.classifiers.bayes.HMM尝试对我的一些数据进行分类,但似乎无法找到我的ARFF文件应该如何显示的任何示例......文档对我来说并不是很清楚。在Weka中使用HMM

所以我明白,HMMs需要时间序列数据,我的问题是如何在我的数据集中表示?我是否应该在每条特征线前添加另一个“数字”索引?例如,这里是我的特征线的3(总共有十万10秒,但都遵循这种格式):

2,2.217950,2.235440,0.031252,2.224833,2.301141,0.093227,1.940765,1.973835,0.064434,1 2,2.216870,2.235608,0.035570,2.217950,2.235440,0.031252,2.023161,2.531513,0.623939,1 2,2.216577,2.246109,0.045806,2.216870,2.235608,0.035570,2.497010,2.529199,0.050049,1

每一行都包含几个能量读数,它们都按顺序排列:第一行出现在第一行,第二行在第二行读数后出现1秒,第三行,1秒等。

如何使用HMM在韦卡训练这套球衣? (是的,我知道我需要一个单独的测试数据集,这也是一个时间序列)

谢谢!

+0

我忘了提及我需要5个状态:1,2,3,4,5。他们应该以一定的概率从一个到另一个。例如,如果当前时隙处于状态3,则更可能进入状态2和4,而不是1和5. 状态位于最后一行(作为示例在下面编辑): 2, 2.217950,2.235440,0.031252,2.224833,2.301141,0.093227,1.940765,1.973835,0.064434,1.2.216870,2.235608,0.035570,2.217950,2.235440,0.031252,2.023161,2.531513,0.623939,2,2.216577,2.246109,0.045806,2.216870, 2.235608,0.035570,2.497010,2.529199,0.050049,3 – stellarowl12

回答

2

HMMweka 主页:

的HMM分类器仅在序列的数据,这在Weka中是表示为一个关系属性工作。数据实例必须具有单一的名义类属性和单个关系序列属性[...]

2

我有同样的问题,并且同样是新的,所以任何更正将不胜感激,但这是我想出的。

有在下载时非常有用的例子,特别是numericsequence.arff你想这样的作品格式:

@relation relation_name 
@attribute name_of_instance_attribute {instance_0,instance_1,...instance_n} 
@attribute class {relation_type_0, relation_type_1, ... relation_type_n} 
@attribute name_of_sequence relational 
    @attribute sequence_variable_0 type 
    @attribute sequence_variable_1 type 
@end sequence_variable_1 type 
@data 

instance_0,relation_type_n,'5,6\n7,8\n9,10' 
instance_1,relation_type_n,'2,3\n4,5\n6,7' 

可以肯定,如果你正在编写一个程序来写你的ARFF您插入“\ n”而不是换行符,它似乎想要一行文字'\ n'而不是一个真正的换行符。

+0

我在哪里可以下载numericsequence.arff?谢谢, – Foreverniu

+0

这是在HMM weka下载 – Empiricist