2013-12-14 529 views
0

我正在做网络入侵检测系统的项目。 KDD CUP'99数据集是我的输入数据集。我在我的java代码中使用了weka包。我使用“NETBEANS”在KDD CUP'99数据集(如DOS,PROBE,U2R)中执行java.Four类型攻击代码,R2L &我工作在这个攻击。 DOS,PROBE &使用Random Forest算法,R2L'S的分类率非常好。但是我想提高U2R攻击的分类率。如何提高随机森林算法?为了提高U2R攻击的分类率,请给我一些建议。改进随机森林算法对U2R攻击进行分类

回答

1

请勿使用该数据集。它有缺陷。 http://www.kdnuggets.com/news/2007/n18/4i.html

因此,我们强烈建议

(1)所有的研究人员停止使用KDD杯'99数据集,

(2)KDD杯和UCI网站上包含一个警告在KDD杯'99 数据集网页通知研究人员已发现一些已知问题 与数据集,并

(3)会议审稿人和期刊 丁纸(甚至outrig ht拒绝它们,如在网络 安全社区中常见的),结果仅从KDD Cup '99 数据集中得出。

让我重复这个数据集不能用于网络入侵检测。它不反映现实,它是模拟的和旧的数据。它看起来无处不在反正任何目前的攻击模式

除此之外,文件应该是ASCII文本文件。使用好的工具,你不需要提取它,因为它们可以实时解压缩(实际上,您的webbrowser可能会使用一些网络服务器即时使用此压缩)

对于运行时基准测试以外的任何其他不会使用它。

+0

你是对的@ Anony-Mousse.I读了关于kdd cup'99的数据集,我可以使用哪种数据集最适合网络入侵检测系统?请给我建议。 –

+0

我不知道有任何这样的数据集正在广泛使用。问题是**攻击迅速变化**。使用超过半年的数据集不会产生工作系统。恕我直言,你甚至需要“预警”数据。一旦标记了数据,攻击应该已经被简单的过滤规则和软件错误修正所阻止。 –

+0

我不知道是否有其他数据集用于网络入侵,但您可以在http://crawdad.cs.dartmouth.edu上找到网络数据集 – hpid91