我正在实施C4.5,并在我的计算中得到(对于某些示例)信息增益的负值。我读了Why am I getting a negative information gain,但我的发现看起来不一样。我推杆我的计算脱颖而出,我也得到了相同的结果如下: My calculations 我到底做错了什么? 我试图重新计算它的,也是我得到负值是在下面的图片: Newest calculations with da
我有一个由数千行组成的语料库。为了简单起见,让我们考虑语料库为: Today is a good day
I hope the day is good today
It's going to rain today
Today I have to study
如何使用上面的语料库计算熵?对熵的公式表示为: 这是我的理解至今:皮指其为frequency(P)/(total num of ch