在我的PHP脚本我想转换为PDF文件,HTML格式,虽然这样生成的HTML文件的内容不应被打扰....PDF到HTML的转换在PHP
我发现http://sourceforge.net/projects/pdftohtml/但是命令行工具,需要shell访问。第二件事就是生成的html文件内容受到干扰..
在我的PHP脚本我想转换为PDF文件,HTML格式,虽然这样生成的HTML文件的内容不应被打扰....PDF到HTML的转换在PHP
我发现http://sourceforge.net/projects/pdftohtml/但是命令行工具,需要shell访问。第二件事就是生成的html文件内容受到干扰..
shell命令是否可以从php执行?
$rtn = exec ('CLI Command to execute', $emptyVartoCaptureOutput);
命令在shell中执行,运行PHP脚本(_www或用于从Apache网络服务器运行脚本类似)的用户的环境下运行。当您提供第二个可选参数时,命令的所有输出都会捕获到数组中。
看起来像这样可能会解决您的问题。
在回答您的评论:
你在原来的文章中引用的工具是命令行工具,你将执行 - 你需要找出确切的要执行的命令包括任何和该命令的所有参数。
我不熟悉你引用的工具,但我怀疑它有各种选项。有几个重要的选项可以看到生成的html在哪里。我猜想它可以转到一个文件(这将需要_WWW具有写入权限到一个具有巨大安全风险的目录)或出来。当你使用php的exec命令时,当你将可选的第二个参数传递给exec函数时,任何发送到std out的输出将被保存为一个数组,一个新行的新元素。因此,您应该能够从脚本中动态捕获和操作和/或显示输出的html。
对于一个简单的HTML页面,只有从PDF显示HTML,你可能会做这样的事情:
<std header stuff omitted for brevity>
<?php
$rtn = exec('CLI Command to Execute -a option1 -b option2', $ouputted_html);
foreach ($ouputted_html as $val){
echo $val . "\n";
}
?>
</body>
</html>
你可以使用回声破灭( “\ n”,$ outputted_html);代替foreach循环来完成相同的功能,但是如果您选择利用foreach循环,则可以对每行进行一些控制。
请注意,生成的html可能包含或不包含标题信息,您将不得不尝试并查看。显然你可以添加一个标准的HTML页面需要或减去,如果已经提供。
因此,您现在有基础将PDF文件显示为html,如果您需要与该工具的复杂性有关的特定帮助,我建议您寻找专用于该工具的论坛或listserv,或者可能需要开发人员的帮助(s)阅读文档和常见问题后。
最好的办法可能是找到一个开源的PDF转换器,并研究源代码。
有很多在线转换器,大概是。谷歌提供转换发现在搜索任何PDF文件并调用它的视图作为HTML“
你已经问同样的问题:http://stackoverflow.com/questions/1383176/pdf-to-html-conversion -in-php – AAA 2009-09-05 12:26:24
如果你看起来超出标题,但不是完全相同的问题,但仍然很混乱。 – pavium 2009-09-05 12:27:59
嘿杰米刘易斯,请再次阅读这两个问题,两者都不同。 – 2009-09-10 06:53:31