需要从PDF线使用iTextSharp的提取文本行，并把输入的线

-1

上每一个我的itextsharp library此功能，以提取线PDF文本行：需要从PDF线使用iTextSharp的提取文本行，并把输入的线

PdfTextExtractor.GetTextFromPage(reader, page);

...但我需要把ENTER每行末尾 pdf即使有空行它应该读空行。

来源

2013-05-06 shailendra

'PdfTextExtractor.GetTextFromPage' ** **不把结束行标志在每次识别行的末尾（参见方法'了'LocationTextExtractionStrategy'的GetResultantText'：'sb.Append（ '\ n'）;'）。这就是说，在PDF中通常有*没有**行结尾**或**行** *因此，如果iText的启发式*将这些概念解释为PDF页面内容*并不适合您，那么您可能需要一个自定义的'TextExtractionStrategy'实现。如果您需要帮助，请提供更多详细信息，尤其是您得到的内容，您想要的内容以及说明您的问题的样本PDF。 – mkl 2013-05-06 08:59:30

@mkl的+1：在PDF中没有“一行”这样的东西，也没有像“ENTER”这样的东西。内容添加在绝对位置;它不是按行组织的。 – 2013-05-06 10:18:33

请通过以下链接：堆栈上溢的

来源

2013-05-06 06:10:28

欢迎来到Stack Overflow！虽然这可能在理论上回答这个问题，[这将是更可取的]（http://meta.stackexchange.com/q/8259）在这里包括答案的重要部分，并提供供参考的链接。 – JJJ 2013-05-06 06:12:52

关于堆栈溢出链接：请明确说明您确实想要参考使用'PdfTextExtractor'类的答案。 – mkl 2013-05-06 08:47:52

读入字符串变量然后分裂例如String page = PdfTextExtractor.getTextFromPage（reader，2）;

  String s1[]=page.split("\n");

来源

2013-05-09 12:48:11 adebayo

它不起作用。 – 2017-03-06 13:32:52

需要从PDF线使用iTextSharp的提取文本行，并把输入的线

回答

相关问题