2011-09-23 476 views
0

我使用PoDoFo 0.9.1库来读取Win32 XP中文版操作系统中包含中文字符的PDF文件。 我发现PoDoFo的示例项目“podofotxtextract”可以优雅地阅读英文PDF,但是,当我打开中文PDF文件时,没有任何解析出来。任何人有建议?非常感谢。如何使用PoDoFo的“podofotxtextract”(C++)示例从PDF文件读取中文文本

+0

这就是即将开源不错,你可以自己修正错误。 –

+0

@ chinloon - 你可以分享你如何在你的项目中使用podofo库,或者可以与我分享一些示例:) – siva

回答

1

我使用Objective C在现有PDF文件上添加注释。
BTW:只是尝试

PdfString pdfString(reinterpret_cast的<常量pdf_utf8 *>( “你读...的字符”));

这是下面一些代码...

PdfPage* pPage = doc->GetPage(pageIndex); 
if (! pPage) { 
    // couldn't get that page 
    return; 
} 
PdfAnnotation* anno; 

anno = pPage->CreateAnnotation(ePdfAnnotation_Text, rect); 

PdfString sTitle(reinterpret_cast<const pdf_utf8*>([@"中国" UTF8String])); 
PdfString sContent(reinterpret_cast<const pdf_utf8*>([@"这是一个中文测试"UTF8String])); 
// to parse this annotation 
// anno->GetContents().GetStringUtf8().c_str() 
anno->SetTitle(sTitle); 
anno->SetContents(sContent); 
anno->SetOpen(bOpen);