我有项目将在jav中,我需要从科学PDF文档中筛选出以下信息。 作者,标题和参考文献。 从PDF文档中获取这些特定信息有几个问题。 1.撰写论文没有具体的方法,因此每篇论文看起来都不一样。 2.对于程序而言,很难区分名称和实际描述的对象。 还有一些问题,但这会让我们离真正的问题太远。 我的问题是,是否可以选择获取某种类型的PDF文档中的信息, ,比如在此PDF中使用了哪种字体大小,或者使用了哪种不同的字体? 是否有任何方法或编辑器可以以可理解的方式查看pdf内容,以便我可以在需要的信息周围找到标志性功能。所以我可以让一个algorythem正确地提取它们。 Thx为您提供帮助。 我很抱歉我的英语不是我的母语。如何访问特定的pdf信息?
1
A
回答
2
您可以使用SDK(如Apache PDFBox)来读取PDF文件的属性以及其他文件内容。
+1
Thx.I会试一试。 – 2014-10-01 16:19:40
+0
不要忘记接受答案,如果它解决了你的问题:) – derelict 2014-10-06 10:03:49
+1
对不起。现在接受。 – 2014-10-07 10:33:47
相关问题
- 1. 如何访问Perfmon信息?
- 2. 如何访问PFObject内部的信息?
- 3. 如何提取特定的xml信息
- 4. 如何使一个特定的信息可以在masterpage,page和usercontrol访问
- 5. 如何访问XAML gridview的选定行中的信息?
- 6. 我如何访问Google日历信息?
- 7. 如何访问MP3标记信息
- 8. 如何查询问题的特定信息?
- 9. 访问嵌套的信息
- 10. 如何从Django模型定义访问用户信息?
- 11. jqGrid访问额外信息
- 12. 访问航班信息
- 13. 从SDK访问iPhone信息
- 14. 从javascript访问chrome.devtools.network信息
- 15. x509v3授权信息访问
- 16. 访问者信息收集
- 17. 访问其他层信息
- 18. 访问MP3文件信息
- 19. 访问Facebook基本信息
- 20. 如何访问MKAnnotation的特定索引
- 21. 如何访问这个特定的类?
- 22. 如何从PDF中抓取信息?
- 23. Facebook API - 无法访问任何信息
- 24. MSMQ查询特定信息
- 25. 基于二进制格式文档访问特定的二进制信息
- 26. 如何从plist访问特定值?
- 27. 如何从Firebug的控制台访问Firebug的信息?
- 28. 访问HTML表单以外的信息
- 29. 访问web.config中的授权信息
- 30. 访问从NSError返回的信息?
看起来使用IText – kolossus 2014-09-30 14:58:12