information-gain

    2热度

    1回答

    我使用Weka的信息增益的属性选择功能,我试图找出Weka在处理连续数据时使用的具体公式。 我理解熵的常用公式为this,因为数据中的值是离散的。我明白,在处理连续数据时,可以使用微分熵或离散值。我试着看着Weka对InfoGainAttributeEval的解释,并且已经浏览了很多其他的参考资料,但找不到任何东西。 也许它只是我,但谁会知道Weka如何实现这种情况? 谢谢!

    0热度

    1回答

    我正在实施C4.5,并在我的计算中得到(对于某些示例)信息增益的负值。我读了Why am I getting a negative information gain,但我的发现看起来不一样。我推杆我的计算脱颖而出,我也得到了相同的结果如下: My calculations 我到底做错了什么? 我试图重新计算它的,也是我得到负值是在下面的图片: Newest calculations with da

    0热度

    1回答

    我已经通过R中使用FSelector包进行信息增益特征选择中的R install.packages("RWekajars") install.packages("FSelector") library(FSelector) weights <- information.gain(Classname~., df) Attributes attr_importance