我正在处理文档管理项目,我想从pdf中提取文本。我怎样才能做到这一点。我正在使用Itextsharp在本地系统上提取PDF使用itextsharp提取ftp服务器上的pdf文件
这是我用于此目的的功能。 Path是一个FTP服务器路径
public static string ExtractTextFromPdf(string path)
{
using (PdfReader reader = new PdfReader(path))
{
StringBuilder text = new StringBuilder();
for (int i = 1; i <= reader.NumberOfPages; i++)
{
text.Append(PdfTextExtractor.GetTextFromPage(reader, i));
}
return text.ToString();
}
}
它抛出一个异常
'ftp:\\###\index\500199.pdf not found as file or resource.'
[###是我的FTP服务器]
请说明您的具体问题。 –
想要从pdf中提取文本在ftp上..问题是当我写PdfReader reader = new PdfReader(path)时,它会引发异常'file not found as file or resource' – Munavvar
在问题中提供附加信息。 –