上每一个我的itextsharp library
此功能,以提取线PDF文本行:需要从PDF线使用iTextSharp的提取文本行,并把输入的线
PdfTextExtractor.GetTextFromPage(reader, page);
...但我需要把ENTER
每行末尾 pdf即使有空行它应该读空行。
上每一个我的itextsharp library
此功能,以提取线PDF文本行:需要从PDF线使用iTextSharp的提取文本行,并把输入的线
PdfTextExtractor.GetTextFromPage(reader, page);
...但我需要把ENTER
每行末尾 pdf即使有空行它应该读空行。
请通过以下链接:堆栈上溢的
读入字符串变量然后分裂 例如String page = PdfTextExtractor.getTextFromPage(reader,2);
String s1[]=page.split("\n");
它不起作用。 – 2017-03-06 13:32:52
'PdfTextExtractor.GetTextFromPage' ** **不把结束行标志在每次识别行的末尾(参见方法'了'LocationTextExtractionStrategy'的GetResultantText':'sb.Append( '\ n');')。这就是说,在PDF中通常有*没有**行结尾**或**行** *因此,如果iText的启发式*将这些概念解释为PDF页面内容*并不适合您,那么您可能需要一个自定义的'TextExtractionStrategy'实现。如果您需要帮助,请提供更多详细信息,尤其是您得到的内容,您想要的内容以及说明您的问题的样本PDF。 – mkl 2013-05-06 08:59:30
@mkl的+1:在PDF中没有“一行”这样的东西,也没有像“ENTER”这样的东西。内容添加在绝对位置;它不是按行组织的。 – 2013-05-06 10:18:33