我有文件file1
和file2
,其中file2
是file1
的子集。这意味着,如果我遍历file1
,也有一些线路是在file2
,有的都没有,但在file2
没有网上说是不是在file1
。文件中可能有几行文本中具有相同的内容。现在我想知道它们之间的区别,即file1
的所有行不在file2
之间。没有排序的两个文件之间的差异
的diff(1)不是答案,COMM(1)是。
(无论出于何种原因)
但据我了解,为comm
的文件需要先进行排序。问题:两个文件都是有序的(不是排序!),并且这个顺序需要保留。所以我真正想要的是遍历file1
,并检查每一行,如果它也在file2
。如果不是,请将其写入file3
。如果同一内容出现多次,应该保留多次!
有没有办法用命令行来做到这一点?
看起来看第一行后良好。我无法确定地说(文件太长),但我认为这是解决方案。谢谢! –
嗯好吧我只是比较行号。它应该是5213,但它是5211.不幸的是,非常小的差异,但并不完全正常工作。 –
请将file1和file2上传到某处。 – Cyrus