2017-09-05 80 views
-1

在Weka资源管理器中,有一个Generate ...按钮用于生成数据,其中列出了几个数据生成器。Weka的文档生成...按钮

我可以用默认设置运行数据生成器,但不太明白我在看什么。

例如,如果我使用RDG1生成数据,并使用熟悉的pima糖尿病数据集的关系,它使用一组生成数据的规则。我可以轻松保存生成的数据。但是,生成的规则在哪里?

而且从代我的输出文件看起来像这样:

@data 
true,false,false,false,true,false,true,true,true,true,c0 
true,true,false,false,false,true,true,false,true,true,c0 
false,false,true,true,false,true,false,false,false,false,c1 
false,true,false,true,true,false,true,true,false,false,c0 
true,true,false,false,false,true,true,false,false,true,c0 
true,true,true,true,false,false,true,false,true,true,c1 
true,true,false,true,true,false,true,false,false,true,c0 
false,false,true,false,true,true,false,true,false,true,c1 
true,true,false,true,false,true,false,true,true,true,c0 
(etc) 

不符合原始数据的格式(或属性在原始数据的数量),这是

@data 
6,148,72,35,202.2110173,33.6,0.627,50,pos 
1,85,66,29,67.77822497,26.6,0.351,31,neg 
8,183,64,21.74211976,236.7083422,23.3,0.672,32,pos 
1,89,66,23,94,28.1,0.167,21,neg 
0,137,40,35,168,43.1,2.288,33,pos 
5,116,74,23.22841651,118.637693,25.6,0.201,30,neg 
3,78,50,32,88,31,0.248,26,pos  
(etc) 

所以,我真的不知道我在这里看着什么与生成的数据。

回答

1

您可以通过点击在DataGenerator窗口中的命令文本,然后单击More找到每个发电机简要文件:

DataGenerator window

Data generator documentation window

在某些情况下,这种文件将包括一个参考进一步的信息。

还有如何在this video更多数据挖掘使用一个数据发生器用WEKA在线课程的例子,但一旦你阅读文档的最佳教程可能只是产生一些数据集的每一个并检查结果。