我需要阅读复杂PDF中的某些部分。我搜索了网络,有人说FPDF是好的,但它不能阅读PDF,它只能写。有没有一个lib允许获得给定PDF的某些内容?用PHP阅读PDF的内容?
如果不是,读取给定PDF的某些部分是一种好方法吗?
谢谢!
我需要阅读复杂PDF中的某些部分。我搜索了网络,有人说FPDF是好的,但它不能阅读PDF,它只能写。有没有一个lib允许获得给定PDF的某些内容?用PHP阅读PDF的内容?
如果不是,读取给定PDF的某些部分是一种好方法吗?
谢谢!
我在这里看到的两个解决方案:
https://whatisprymas.wordpress.com/2010/04/28/lucene-how-to-index-pdf-files/
那该怎么办?
http://www.phpclasses.org/package/702-PHP-Searches-pdf-documents-for-text.html
PS:我没有测试这个类,只是阅读说明。
那么,我必须注册才能得到它......但谢谢! – EOB 2012-01-12 13:46:47
免费且简单的注册。 – 2012-01-12 19:36:16
$result = pdf2text ('sample.pdf');
echo "<pre>$result</pre>";
如何获得“干净”的文本:source code pdf2text
http://webcheatsheet.com/php/reading_clean_text_from_pdf.php
你如何定义 '某些部分'?按页面?通过文档上的坐标位置?等等; – Jakub 2012-01-12 13:42:25
不确定我自己,我不熟悉PDF结构... Illproly将其转换为文本之前,并解析,使用一些正则表达式。 – EOB 2012-01-12 13:46:07