2011-09-30 52 views
0

我在查找一个java库,该库允许指定输出文件中的最大大小或最大行数,然后将大型xml /文本文件拆分为较小的文件。用于将文本拆分为较小文件的Java库

我看到在SO上有一个2年的问题,但是有针对特定云平台的答案....我只想要一个用于java桌面应用程序的库。

+3

如果您拆分了一个XML文档,那么这些片段将不会很好地形成。 – stivlo

+0

有没有规定? (例如:生成的XML文件必须是有效的XML吗?可以将纯文本文件分割成单词吗?句子?) – NullUserException

+0

嗯,我认为最初我会将单个文件分成多个文件,然后在开始和结束时添加一些固定文本所有拆分文件(以便在所有拆分xml文件中都有正确启动和结束的元素)...如果你有更好的主意,那么请让我知道...... – user893664

回答

0

您可以使用Guava CountingOutputStream来跟踪写入文件的数据量。一次写一行,检查写入的字节数,一旦超过阈值关闭文件并打开一个新的文件。