2012-04-23 135 views
4

我正在使用标准javax.xml包来解析Linux机器上的某些XML文件。我的代码如下:使用javax.xml的Java中的错误文件描述符IOException

try 
{ 
    // Prepare parser 
    DocumentBuilder documentBuilder = documentBuilderFactory 
     .newDocumentBuilder(); 
    Document document = documentBuilder.parse(file.getAbsolutePath()); // This is line 397 
    XPath xPath = xPathFactory.newXPath(); 
    ... 
} 
catch(IOException e) { ... } 

单个的DocumentBuilderFactory由多个线程访问,如同一个单一的XPathFactory,相信这是可以接受的用法。使用上述代码解析XML文件时,偶尔会看到以下错误。

java.io.IOException: Bad file descriptor 
     at java.io.FileInputStream.readBytes(Native Method) 
     at java.io.FileInputStream.read(FileInputStream.java:229) 
     at java.io.BufferedInputStream.fill(BufferedInputStream.java:229) 
     at java.io.BufferedInputStream.read(BufferedInputStream.java:246) 
     at org.apache.xerces.impl.XMLEntityManager$RewindableInputStream.read(Unknown Source) 
     at org.apache.xerces.impl.XMLEntityManager.setupCurrentEntity(Unknown Source) 
     at org.apache.xerces.impl.XMLVersionDetector.determineDocVersion(Unknown Source) 
     at org.apache.xerces.parsers.XML11Configuration.parse(Unknown Source) 
     at org.apache.xerces.parsers.XML11Configuration.parse(Unknown Source) 
     at org.apache.xerces.parsers.XMLParser.parse(Unknown Source) 
     at org.apache.xerces.parsers.DOMParser.parse(Unknown Source) 
     at org.apache.xerces.jaxp.DocumentBuilderImpl.parse(Unknown Source) 
     at javax.xml.parsers.DocumentBuilder.parse(Unknown Source) 
     at mypackage.MyXmlParser.parseFile(MyXmlParser.java:397) 
     at mypackage.MyXmlParser.access$500(MyXmlParser.java:51) 
     at mypackage.MyXmlParser$1.call(MyXmlParser.java:337) 
     at mypackage.MyXmlParser$1.call(MyXmlParser.java:328) 
     at java.util.concurrent.FutureTask$Sync.innerRun(FutureTask.java:284) 
     at java.util.concurrent.FutureTask.run(FutureTask.java:138) 
     at java.util.concurrent.ThreadPoolExecutor$Worker.runTask(ThreadPoolExecutor.java:665) 
     at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:690) 
     at java.lang.Thread.run(Thread.java:799) 

我偶尔(〜的时间的10%)见下面的附加文本:

Caused by: 
java.io.IOException: Bad file descriptor 
     at org.apache.xml.serializer.ToStream.flushWriter(ToStream.java:260) 
     at org.apache.xml.serializer.ToXMLStream.endDocument(ToXMLStream.java:191) 
     at org.apache.xalan.transformer.TransformerIdentityImpl.endDocument(TransformerIdentityImpl.java:983) 
     at org.apache.xml.serializer.TreeWalker.traverse(TreeWalker.java:174) 
     at org.apache.xalan.transformer.TransformerIdentityImpl.transform(TransformerIdentityImpl.java:410) 
     ... 9 more 

当我手动检查文件,我可以看到,失败的文件和所述文件之间没有差别通过。我可以确认通过的文件是有效的XML,没有特殊字符或提前结束。

有谁知道为什么会发生这种情况,以及我如何避免它?

> java -version 
java version "1.5.0" 
Java(TM) 2 Runtime Environment, Standard Edition (build pxa64dev-20061002a (SR3)) 
IBM J9 VM (build 2.3, J2RE 1.5.0 IBM J9 2.3 Linux amd64-64 j9vmxa6423-20061001 (JIT enabled) 
J9VM - 20060915_08260_LHdSMr 
JIT - 20060908_1811_r8 
GC - 20060906_AA) 
JCL - 20061002 
+2

看来你的FileStream在数据读取开始之前被关闭。您可能需要调查为什么它被关闭。 – kosa 2012-04-23 18:44:34

+0

谢谢,如果是这种情况,虽然我找不到任何理由。我没有触及上面发布的javax.xml代码之外的文件。 – Ina 2012-04-24 14:08:57

回答

2

它看起来像一个并发线程的问题。

错误可能在您向我们展示的codelet之外的某个地方。但是对于DocumentBuilderFactory和XPathFactory,我不确定它们是否是线程安全的;它在文档中没有提及。

对于第一次测试,我建议您将解析XML文件的整个代码放到synchronized {}子句中。如果这解决了你的问题,那么它肯定是一个多线程问题。在这种情况下,您必须找出必须同步的代码的最小部分。

+0

似乎修复了它,谢谢。 DocumentBuilderFactory和XPathFactory显然不是线程安全的。 – Ina 2012-04-24 20:00:19