解压缩pdf问题

当我们解压缩PDF文件时，我们得到了一些奇怪的输出，如图所示。（PDF格式在记事本中打开++）

我们试图解压此使用几个库和工具，如mupdf，PDFTK和解压使用zlib的所有流我们自己的.NET应用程序。

所有这些选项都会得到相同的结果。任何人都知道如何使这更可读？

2012-06-29 Thomas

数据需要通过编码进行映射以使其可读。它将以WIn编码（与记事本相同）显示为文本，但不会以其他方式显示 - 您为什么期望它是可读的文本？

2012-06-29 12:01:49

大多数我们在notpad中打开的pdf是完全可读的，我们使用的某些软件压缩的所有pdf都不是。即使解压后 – Thomas

是的，你可以解压缩 PDF文件和其中包含的大多数对象。

但是否，zlib不是唯一可以在PDF中使用的压缩方法。

and no，并非您成功解压缩的每个对象都必须由简单的ASCII字符组成。它们可能仍包含'二进制'，非ASCII字符。并且二进制数据（压缩与否）不会通过'解压缩'转为ASCII ...

2012-06-29 16:02:48

好吧，这听起来是逻辑，有没有什么办法从这个二进制数据获取可读格式的数据？我的意思是Adobe Reader可以将这些信息转化为有用的东西，所以我确信它可以以某种方式进行。 – Thomas

回答