2017-07-17 66 views
2

我有和60k实体的XML文件。我想分批处理20k。我正在使用SAX解析器来解析实体并将其存储在列表中。 我解析了60k个实体并将其存储在文件/数组/列表中,然后分别处理每个实体。我不认为这是最好的解决方案。只读取和处理XML文件的一部分

有什么办法从XML文件中只读取20k个实体,然后处理它们并再次读取XML文件。

+0

你所描述的应该属于你的应用逻辑。你知道你可以随意启动或暂停sax解析器。那么为什么在你收集20k个实体之后不暂停你的解析代码呢? –

+0

是的,这就是我现在一直在想的。将实施它并分享结果。感谢您的建议 –

+0

嗨vtd-xml作者,它的工作原理,我用我的程序中的分裂逻辑。 –

回答

-1

我想你可以使用多线程的概念。创建3个线程,每个线程必须读取20K数据。然后另一个线程将读取另一个20k数据。