我们有两种类型的文件如何找到大文本文件中的差异?
单个大容量文件,这将有有一个预约码的一些记录的 - 该文件大小约为20 MB
AMMA-07 /二千零十七分之一十七12:02: 06-EZZE20170819010101
AMMA-07 /二千零十七分之十七12:02:06-EZZE20170819020202
设置的多个文件具有像下面的记录 - 这个文件将有大约20K-30K记录
000003 | EZZE20170819010101 | 16082017 |您好迈克尔
000003 | EZZE20170819070707 | 16082017 |您好杰克逊
我必须列出在单独的文件(EZZE20170819020202和EZZE20170819070707)不匹配的记录。
文件的大小很大,我需要分割每条记录才能获得与其他文件中的代码匹配的代码,我担心性能和CPU利用率。
是否有任何策略或任何现有库(Java或任何其他技术)提供类似的功能?
20 MB =巨大?什么操作系统,多少内存和你有什么CPU,你担心?试图简单地直接实施它? –
Askig对于图书馆来说是无关紧要的。 –
你试过正则表达式吗? – techprat