2012-06-29 60 views
0

enter image description here解压缩pdf问题

当我们解压缩PDF文件时,我们得到了一些奇怪的输出,如图所示。 (PDF格式在记事本中打开++)

我们试图解压此使用几个库和工具,如mupdf,PDFTK和解压使用zlib的所有流 我们自己的.NET应用程序。

所有这些选项都会得到相同的结果。 任何人都知道如何使这更可读?

回答

0

数据需要通过编码进行映射以使其可读。它将以WIn编码(与记事本相同)显示为文本,但不会以其他方式显示 - 您为什么期望它是可读的文本?

+0

大多数我们在notpad中打开的pdf是完全可读的,我们使用的某些软件压缩的所有pdf都不是。即使解压后 – Thomas

1

是的,你可以解压缩 PDF文件和其中包含的大多数对象。

但是,zlib不是唯一可以在PDF中使用的压缩方法。

and no,并非您成功解压缩的每个对象都必须由简单的ASCII字符组成。它们可能仍包含'二进制',非ASCII字符。并且二进制数据(压缩与否)不会通过'解压缩'转为ASCII ...

+0

好吧,这听起来是逻辑,有没有什么办法从这个二进制数据获取可读格式的数据?我的意思是Adobe Reader可以将这些信息转化为有用的东西,所以我确信它可以以某种方式进行。 – Thomas