2011-06-06 299 views
1

我读过香农理论的熵,以及如何实现这样一个二进制文件的算法(很容易)二进制文件中的熵 - 目的是什么?

但我不明白什么是计算熵的一个.exe或任何二进制文件

我可以理解计算电信消息的熵(最坏的情况:每个符号具有相同的概率),但我无法获得二进制文件的目的。

有人能解释我这个吗?

回答

4

假设一些信息或动态系统或分布。熵是信息/系统/分布中的无序度量。如果熵增长紊乱也会增长。如果熵是0,这意味着没有障碍,分布是不变的。

将所有这些应用到文件中,我可以假设,如果文件中的混乱是很高的文件很难压缩。低熵文件(该文件中的大部分符号重合)被压缩得更好。一般来说,我认为低熵文件将更容易处理。

+0

我没有想到这一点,谢谢你绝对是对的!无损算法,如简单的RLE或LZW或霍夫曼编码可以获得同样包装算法的优势 – 2011-06-06 19:04:36

1

现在,应用程序计算二进制文件中的熵的大部分时间都与防病毒软件相关。防病毒使用Entropy猜测文件是否被压缩/解压缩。通过了解熵级别,如果二进制文件被加密或者没有加密,你也可以得到一个很好的主意。

相关问题