2017-09-26 55 views
0

我正在使用iTextSharp版本5.5.12iTextSharp GetTextFromPage Only返回首页

该代码知道我的pdf中有10个页面。在我的循环中,只返回第一页。

PdfReader Pdf = new PdfReader(PATH_TO_PDF); 

    for (intPageNum = 1; intPageNum <= Pdf.NumberOfPages; intPageNum++) 
    { 

     ITextExtractionStrategy strategy = new LocationTextExtractionStrategy(); 
     string strPageText = PdfTextExtractor.GetTextFromPage(Pdf, intPageNum, strategy); 

    } 

当我步循环的所有十次迭代,只在第一次迭代确实strPageText有任何文字。

对我在做什么有什么想法吗?

在此先感谢。

+1

我使用完全相同的代码,它适用于我,也许你的PDF文件已损坏或什么的。您是否尝试过使用其他文件? – CNuts

回答

0

“问题”似乎是一个扫描软件设置,将多个pdf文件合并为一个文档(文件)。

Image Capture Plus软件在文件选项卡上的可搜索PDF的OCR设置下有一个作业设置。确保它被设置为“所有页面”。