2016-03-04 118 views
-4

有人知道压缩html代码的最佳算法吗? 我不在乎速度,字典大小和其他类似的东西,但只是最终压缩算法Html压缩

我知道gzip,但我想要更好的东西。

+0

你压缩传递给你有充分的事:有可能的解压缩算法对bzip2的和LZMA,你应该检查出的JavaScript端口,但要知道,这些不是由本地浏览器支持在另一端的控制?例如不是一个网页浏览器,它只限于它所知道的格式。 – scunliffe

+0

@scunliffe不是网络浏览器,我可以完全控制另一端,所以我可以选择任何算法 – Neir0

+0

我的猜测是,如果您的html源代码_only_包含标准标签和属性,您可以使用类似的东西击败通用算法霍夫曼用已知的常见HTML短语的固定字典,但如果你的html甚至有适量的自定义文本,你将很难击败bzip2和朋友。用自定义字典的一个问题是,您遇到的_everything_必须存在,否则您需要使用擒纵逻辑,这会导致您的压缩流增长。 –

回答

1

你应该看看bzip2和lzma。两者都可以具有比gzip更好的压缩比,并且速度也更快。

您是否将此HTML代码提供给客户端浏览器?

​​

+0

问题是我知道一些关于我要压缩的数据。因此,我可以使用这些信息获得比“常用”算法(如zip rar等)更好的结果。例如,我可以在我的文档中创建最常用术语的字典,并将其用于压缩。对于确定的div,a和其他标签将位于顶部。所以我认为可以实现更好的结果 – Neir0

+0

zlib允许使用预设字典。这听起来更像你正在寻找的东西。 –