2011-03-28 84 views
0

我使用apache pdfbox 1.5从pdf中提取文本。这是正在使用的code。这对于某些pdf似乎工作正常。但是对于一个pdf,出现以下错误失败。让我知道,如果一个人遇到这样的问题&解决apache pdfbox问题java.lang.IndexOutOfBoundsException:索引:2,大小:2

java.lang.IndexOutOfBoundsException: Index: 2,Size: 2 at java.util.SubList.rangeCheck(AbstractList.java:864) at java.util.SubList.get(AbstractList.java:737) at org.apache.fontbox.cff.CharStringConverter.drawCurve(CharStringConverter.java:415) at org.apache.fontbox.cff.CharStringConverter.handleType2Command(CharStringConverter.java:277) at org.apache.fontbox.cff.CharStringConverter.handleCommand(CharStringConverter.java:81) at org.apache.fontbox.cff.CharStringHandler.handleSequence(CharStringHandler.java:53) at org.apache.fontbox.cff.CharStringConverter.handleType2Command(CharStringConverter.java:307) at org.apache.fontbox.cff.CharStringConverter.handleCommand(CharStringConverter.java:81) at org.apache.fontbox.cff.CharStringHandler.handleSequence(CharStringHandler.java:53) at org.apache.fontbox.cff.CharStringConverter.convert(CharStringConverter.java:64) at org.apache.fontbox.cff.CFFFont$Mapping.toType1Sequence(CFFFont.java:374) at org.apache.fontbox.cff.AFMFormatter.renderFont(AFMFormatter.java:126) at org.apache.fontbox.cff.AFMFormatter.printFontMetrics(AFMFormatter.java:64) at org.apache.fontbox.cff.AFMFormatter.printFont(AFMFormatter.java:57) at org.apache.fontbox.cff.AFMFormatter.format(AFMFormatter.java:50)

+0

此问题已解决?我在同一时间被困住了......谢谢。 – 2012-08-16 22:17:58

回答

0

是否有可能分享其创造该问题的PDF文件?

此外,请检查command line version是否与启用-force选项一起使用。

+0

嗨Nikhil,我已经上传了pdf [here](http://cid-a3aa7f7d9888874d.office.live.com/self.aspx/Public/getting%5E_started%5E_with%5E_Flex3.pdf)。让我知道你是否能够提取文本 – dazzle 2011-03-29 06:43:18

+0

对不起,似乎没有工作。我也在这个文件上尝试过[icePDF](http://www.icepdf.org/),但那也无法提取文本。 – nikhil500 2011-03-30 06:32:43

+0

好的,谢谢Nikhil的帮助!现在我已经向Apache提出了一个jira问题。让我们看看他们有什么话要说。 – dazzle 2011-03-30 07:28:42

相关问题