2010-03-24 657 views
0

我想使用webservice api上传pdf文件。但是这个api不能用于pdf文件。它工作正常的文本文件。当我尝试上传PDF文件,它给错误 Client-SOAP-ERROR:编码:字符串'%PDF-1.4%\ xc7 ...'不是一个有效的utf-8字符串如何将pdf转换为utf-8

所以我们可以将这个pdf文件转换为utf8字符串。 我使用PHP作为脚本语言。

回答

1

一个PDF是一个二进制文件。这听起来像你把它视为纯文本。

你确定你按照你应该的方式上传了吗?这听起来像是将原始PDF文件放入您的SOAP请求中 - 如果出现这种情况,您似乎应该对Base64进行编码。否则,你会遇到各种特殊的XML字符出现在文件中的麻烦,完全搞乱了文件。

换句话说,仔细检查API并确保你不应该对文件做些什么(提示:如果这个东西接受这样的文件,你可以肯定你需要做 )。

0

听起来像API只支持纯文本。您需要更改API以支持其他文件格式。

...假设你不希望将PDF转换为纯文本,这可能与东西可以做这样pdftotext

+0

@David可以将PDF文件转换为utf-8字符串,因为此api支持它。 – Apple 2010-03-24 07:52:23