2009-09-05 69 views
-4

在我的PHP脚本我想转换为PDF文件,HTML格式,虽然这样生成的HTML文件的内容不应被打扰....PDF到HTML的转换在PHP

我发现http://sourceforge.net/projects/pdftohtml/但是命令行工具,需要shell访问。第二件事就是生成的html文件内容受到干扰..

+2

你已经问同样的问题:http://stackoverflow.com/questions/1383176/pdf-to-html-conversion -in-php – AAA 2009-09-05 12:26:24

+0

如果你看起来超出标题,但不是完全相同的问题,但仍然很混乱。 – pavium 2009-09-05 12:27:59

+0

嘿杰米刘易斯,请再次阅读这两个问题,两者都不同。 – 2009-09-10 06:53:31

回答

1

shell命令是否可以从php执行?

$rtn = exec ('CLI Command to execute', $emptyVartoCaptureOutput); 

命令在shell中执行,运行PHP脚本(_www或用于从Apache网络服务器运行脚本类似)的用户的环境下运行。当您提供第二个可选参数时,命令的所有输出都会捕获到数组中。

看起来像这样可能会解决您的问题。

在回答您的评论:

你在原来的文章中引用的工具是命令行工具,你将执行 - 你需要找出确切的要执行的命令包括任何和该命令的所有参数。

我不熟悉你引用的工具,但我怀疑它有各种选项。有几个重要的选项可以看到生成的html在哪里。我猜想它可以转到一个文件(这将需要_WWW具有写入权限到一个具有巨大安全风险的目录)或出来。当你使用php的exec命令时,当你将可选的第二个参数传递给exec函数时,任何发送到std out的输出将被保存为一个数组,一个新行的新元素。因此,您应该能够从脚本中动态捕获和操作和/或显示输出的html。

对于一个简单的HTML页面,只有从PDF显示HTML,你可能会做这样的事情:

<std header stuff omitted for brevity> 
<?php 
$rtn = exec('CLI Command to Execute -a option1 -b option2', $ouputted_html); 
foreach ($ouputted_html as $val){ 
    echo $val . "\n"; 
} 
?> 
</body> 
</html> 

你可以使用回声破灭( “\ n”,$ outputted_html);代替foreach循环来完成相同的功能,但是如果您选择利用foreach循环,则可以对每行进行一些控制。

请注意,生成的html可能包含或不包含标题信息,您将不得不尝试并查看。显然你可以添加一个标准的HTML页面需要或减去,如果已经提供。

因此,您现在有基础将PDF文件显示为html,如果您需要与该工具的复杂性有关的特定帮助,我建议您寻找专用于该工具的论坛或listserv,或者可能需要开发人员的帮助(s)阅读文档和常见问题后。

+0

斯科特,可以建议任何命令行应用程序..在此先感谢 – 2009-09-10 06:54:56

+0

你可能会考虑投票答案,即使他们没有完全回答你的问题,你也会发现有帮助。 我会编辑我的原始答案以回应您的评论。 – Scott 2009-09-12 18:41:20

+0

+1好回答 – jycr753 2014-01-29 13:08:25

0

最好的办法可能是找到一个开源的PDF转换器,并研究源代码。

有很多在线转换器,大概是。谷歌提供转换发现在搜索任何PDF文件并调用它的视图作为HTML“