24
A
回答
22
边界推动压缩机结合疯狂的结果算法。常见的算法包括:
- 的和here - 洗牌字符(或其他比特块)与可预测的算法,以增加重复块这使得源更容易压缩。正常情况下会发生解压缩,并且反向转换会导致结果不重排。注意:单独使用BWT实际上并不压缩任何内容。它只是使源更容易压缩。
- Prediction by Partial Matching (PPM) - arithmetic coding的演变,其中预测模型(上下文)是通过处理有关源与使用静态概率的统计信息来创建的。尽管它的根源在于算术编码,但结果可以用霍夫曼编码或字典以及算术编码来表示。
- 上下文混合 - 算术编码使用静态上下文进行预测,PPM动态选择单个上下文,上下文混合使用许多上下文并权衡其结果。 PAQ使用上下文混合。 Here's高级概述。
- Dynamic Markov Compression - 与PPM相关,但使用比特级上下文与字节或更长。
- 此外,Hutter奖参赛者可以用外部字典中的小字节条目替换常见文本,并使用特殊符号区分大小写文本,而不是使用两个不同的条目。这就是为什么他们擅长压缩文本(特别是ASCII文本),而不是像常规压缩那样有价值。
Maximum Compression是一个非常酷的文本和一般压缩基准站点。 Matt Mahoney发布另一个benchmark。 Mahoney可能特别感兴趣,因为它列出了每个条目使用的主要算法。
3
0
如果您想将PAQ作为程序使用,您可以在基于debian的系统上安装zpaq
软件包。用法是(也man zpaq
见)
zpaq c archivename.zpaq file1 file2 file3
压缩为约1/10日一个zip文件的大小的。 (1.9M VS 15M)
相关问题
- 1. 文本压缩 - 什么算法使用
- 2. 压缩文件中记录的压缩算法是什么?
- 3. 什么是C++的当前状态AMP
- 4. Microsoft ProClarity的当前状态是什么?
- 5. AspectJ的当前状态是什么?
- 6. 什么是PocoCapsule当前状态?
- 7. 使用什么语音压缩算法?
- 8. 在JavaScript中压缩纯文本?
- 9. 压缩算法
- 10. 什么是数据转储的最佳压缩算法
- 11. 增加数字的最佳压缩算法是什么?
- 12. 什么是提取结构/压缩序列的好算法?
- 13. 保证压缩比的压缩算法?
- 14. 什么是这种压缩方法?
- 15. 什么是“压缩JSON”?
- 16. SignalR客户端的Java端口的当前状态是什么?
- 17. 算法Html压缩
- 18. Zend中加速器的当前状态是什么?
- 19. 斯卡拉工具的当前状态是什么?
- 20. 什么是gmail html模板的当前CSS状态?
- 21. 什么是Rust支持iOS的当前状态?
- 22. PHP社区的当前状态是什么?
- 23. Cookie2规范的当前状态是什么?
- 24. 64位Windows上GHC的当前状态是什么?
- 25. 在python中压缩文本的代码是什么?
- 26. 压缩当前数据库
- 27. 什么是MSI文件使用的压缩方法?
- 28. 什么是压缩文件名的好方法?
- 29. 获取webkit webview当前选定文本的方法是什么?
- 30. 缩短纯文本文本
我看到一旦一个(模拟)的文章提出文本的有损压缩,具有优良的性能(大小!)......很有趣。 – PhiLho 2008-10-25 14:18:15
@PhiLho嘿,这基本上就是Summly做:) http://www.theregister.co.uk/2013/03/25/yahoo_buys_summly/ – 2013-05-04 21:38:21