Q
提取PDF注释
1
A
回答
1
您需要了解页面的实际内容(使用页面的内容流中的PDF语法进行描述的内容)与添加到页面的注释之间存在差异(在页面词典的/Annots
条目的注释词典中描述的内容)。
到目前为止,您正在提取注释词典的内容,但是您还希望使用注释的/Rect
条目从内容流中提取其位置已标识的内容。你需要解析页面的内容流来做到这一点。
请到official iText web site和阅读常见问题解答,更具体:How to read text from a specific position?
假设reader
是你PdfReader
例如,rect
是Rectangle
定义要提取文本的位置,并page
相应的页面数,那么你可以创建一个RenderFilter
并使用LocationTextExtractionStrategy
这样的:
RenderFilter[] filter = {new RegionTextRenderFilter(rect)};
ITextExtractionStrategy strategy =
new FilteredTextRenderListener(
new LocationTextExtractionStrategy(), filter);
String text = PdfTextExtractor.GetTextFromPage(reader, page, strategy));
相关问题
- 1. 使用iText提取PDF的特定注释的评论
- 2. 寻找一个linux PDF库来从PDF中提取注释和图像
- 3. 从pdf解析注释
- 4. 在iPhone SDK中注释PDF
- 5. 从wordpress函数中提取注释url
- 6. 从xml中从GATE提取注释
- 7. PHP反射;提取非块注释
- 8. 在SDG 2.0中提取注释,提取策略问题
- 9. 使用PHP从PDF中提取注释和书签等元数据
- 10. 如何从PDF文件中提取注释和突出显示的部分
- 11. PDF中的FileAttachment注释:对同一文件的几个注释
- 12. 在linux上使用pdf注释
- 13. PDF文件中的数学注释
- 14. 使用PDFKIt创建PDF注释iOS 11
- 15. WKWebview不会显示PDF注释
- 16. PDF文本注释样式应用
- 17. 使用perl添加注释到pdf
- 18. 使用Quartz创建PDF注释(iOS)
- 19. 从浏览器中添加PDF注释
- 20. 通过C#复制pdf注释
- 21. 在线添加注释到PDF文件
- 22. PDFKit - 未在PDF上显示注释
- 23. 使用iText阅读PDF注释
- 24. 用于iPhone的PDF查看/注释库?
- 25. 在代码中使用PDF注释
- 26. 如何绑定PDF的存储注释
- 27. 从PDF中删除空注释
- 28. 使用Quartz 2D制作PDF注释
- 29. DSocuSign提醒和注释
- 30. 提取PDF文本
为PDFBox的答案是相同的重新PDF内部。当然代码是不同的。要从注释区域提取,请参阅源代码下载中的PrintURL示例。 –
@TilmanHausherr您是否拥有PrintURL的C#代码? – Ahmad
不,只有java。但是C#和java非常相似。 –