2011-10-01 41 views
1

您好我有这样表示一些数据多数民众赞成:模糊C均值在MATLAB TCP转储集群

从中根据DARPA的集KDD杯1999年
0,tcp,http,SF,239,486,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,8,8,0.00,0.00,0.00,0.00,1.00,0.00,0.00,19,19,1.00,0.00,0.05,0.00,0.00,0.00,0.00,0.00,normal. 

它。

我拥有的文本文件具有这样的行和行数据,在matlab中有可以通过键入findcluster使用的通用集群工具,但它只接受.dat文件。

我也不太确定它是否会接受这样的格式。我也不知道为什么转储文件中有这么多尾随零。

任何人都可以帮助我如何利用文本文件,并运行它通过matlab中的fcm聚类方法?代码帮助真的需要。

回答

2

FINDCLUSTER简直是两个聚类算法GUI界面:FCMSUBCLUST

首先,您需要从文件中读取数据,寻找到TEXTSCAN函数,该函数。

然后你需要处理非数字属性;删除它们或以某种方式转换它们。据我所知,这两种算法只支持数字数据。

访问KDD cup数据集的原始网站,找出每个属性的描述。