我通过ItextSharp库阅读pdf文档。 但这些文件是捷克语使用变音符号(řěššč等) 我怎样才能读这个字符?任何想法?或者,是否有一些解决方案将这些字符替换为正常的r e z s c? 这是我的方法中的代码。谢谢ItextSharp - 拨号字符
PdfReader reader = new PdfReader("M:/ShareDirs_KSP/RDM_Debtors/DMS_PROD/" + src);
// we can inspect the syntax of the imported page
String text = new String();
for (int page = 1; page <= 1; page++) {
text += PdfTextExtractor.getTextFromPage(reader, page);
}
reader.close();
如果PDF创建正确,那么应该正确解析字符。您使用的是哪种版本的iText? PDF中的字体是作为简单字体还是复合字体存储的?如果你不知道区别,请阅读http://stackoverflow.com/questions/26631815/cant-get-czech-characters-while-generating-a-pdf。 – 2014-10-31 09:10:41
我有5.5.2版本。 我不写,但我只是阅读。我可以在哪里设置编码? – 2014-10-31 09:21:27