2011-12-16 92 views
-2

我有一个pdf文件,有信息,在表中列出。pdf格式为xml或html或文本格式

如何将其转换为html或xml或文本来读取像表格一样的文本?

有什么好的方案吗?

Perl模块和.Net类都很好。也许好的可执行控制台应用

XMLFile = new PDFTOXML('file.pdf'); 
    String[] StrArray = XMLFile.getText(); 

就像这样。 最好的方法是从xml获取表格的能力。

谢谢!

回答