0
我想用Tika
来提取一些文件合成的文本,如.doc
,.ppt
等等。
目前我依赖于tika-app-1.2.jar
,但我认为依靠这个jar不是一个好主意,因为这个jar是可运行的。此外,在解析.ppt
文件它给了我此运行时异常:我需要依赖哪一罐蒂卡?
org.apache.tika.exception.TikaException: Unexpected RuntimeException from [email protected]
at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:244)
at org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:242)
at org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:120)
...
我深深一派这个问题,并发现这个问题是由apache-poi
并嵌入tika-app
引起的。
我的问题是,我必须依赖哪些罐子?
- 蒂卡
- 蒂卡核心
- 蒂卡束
- 蒂卡父母
- 蒂卡-应用
谢谢,你的回答非常正确。 – user2041057 2013-04-27 13:32:39
@ user2041057很高兴能帮到你! – Jazzepi 2013-04-27 15:34:43