2010-08-04 135 views
1

我想创建一个程序,用于从超大的500MB大小的XML文件生成内容。我需要在不同的时间从文件中获取数据,但用户愿意等待一段时间,并且全部在本地机器上完成。解析,处理和使用非常大的XML文件

我womdering如果任何人有任何有关建议:

实现语言 是否X路径是够轻查询的(当然是巨大的)数据库 任何其他意见

我大概只需要使用上不到1%的数据,我不能指望事先做好处理准备文件。

任何提示?

回复评论:我可以打开文件,但只能读入文件,然后再写出来。所以不是真的,基本上。我只使用这个文件一次,用xml文件中的select(和非确定性选择)条目生成这个'content'。然后我再也不需要这个文件。

+0

你有过XML文件中的任何控制?你能把它分解成小块吗?你多久处理一次文件?你是否曾经多次处理同一个文件? – 2010-08-05 00:31:34

+0

你看过vtd-xml吗? – 2010-08-10 08:13:38

回答

1

我看到这个link在计算器这在一定程度上与此有关

+0

谢谢,我也看到了。我不想去Java,但我认为这可能是最好的选择。我会检查并报告回来! – mtrc 2010-08-05 10:07:22

+0

好的,那是它 - 有点。我最后决定使用Python并使用SAX解析器。我觉得我将来可能会构建一个临时数据库,因为我越发展这个应用程序越多,我发现自己希望对数据进行丰富的搜索,但现在 - SAX是要走的路! – mtrc 2010-08-05 14:30:59