如何使用PoDoFo的“podofotxtextract”（C++）示例从PDF文件读取中文文本

我使用PoDoFo 0.9.1库来读取Win32 XP中文版操作系统中包含中文字符的PDF文件。我发现PoDoFo的示例项目“podofotxtextract”可以优雅地阅读英文PDF，但是，当我打开中文PDF文件时，没有任何解析出来。任何人有建议？非常感谢。如何使用PoDoFo的“podofotxtextract”（C++）示例从PDF文件读取中文文本

来源

2011-09-23 chinloon

这就是即将开源不错，你可以自己修正错误。 –

@ chinloon - 你可以分享你如何在你的项目中使用podofo库，或者可以与我分享一些示例:) – siva

我使用Objective C在现有PDF文件上添加注释。
BTW：只是尝试

PdfString pdfString（reinterpret_cast的<常量pdf_utf8 *>（ “你读...的字符”））;

这是下面一些代码...

PdfPage* pPage = doc->GetPage(pageIndex); 
if (! pPage) { 
    // couldn't get that page 
    return; 
} 
PdfAnnotation* anno; 

anno = pPage->CreateAnnotation(ePdfAnnotation_Text, rect); 

PdfString sTitle(reinterpret_cast<const pdf_utf8*>([@"中国" UTF8String])); 
PdfString sContent(reinterpret_cast<const pdf_utf8*>([@"这是一个中文测试"UTF8String])); 
// to parse this annotation 
// anno->GetContents().GetStringUtf8().c_str() 
anno->SetTitle(sTitle); 
anno->SetContents(sContent); 
anno->SetOpen(bOpen);

来源

2011-12-29 04:06:46 Alix

如何使用PoDoFo的“podofotxtextract”（C++）示例从PDF文件读取中文文本

回答

相关问题