2016-02-04 14 views
3

我有一个关于熵解释的问题。对于我数据集中的每个人,我有一个长度为17个字符(年)的字符串/序列。我特别感兴趣的是在这个观察期内发生了多少变化。解释熵大小的经验法则

我在考虑用R的TraMineR包来计算序列内熵。我知道这可以归一化,所以最大熵变为1(显然,最小值为0)。我的问题是,如果有什么经验法则可以说什么是高熵和什么是低熵(例如在相关系数的情况下)。例如,0.4是高还是低?

谢谢。

回答

1

序列内熵是强烈的上下文相关的。为了确定一个特定序列的熵是高还是低,我建议比较它与其他序列的熵或与例如平均内熵的比较。

同样,一组的平均序列内熵,将它与其他组的平均熵进行比较。因此,你可以得出结论,比如女性的职业熵高于男性。