我有一个数据文件fortune包含许多重复的命运。我想删除它们。删除重复文本之间的间隔
财富被%
的划定,所以样本财富文件可能是这样的:
%
This is sample fortune 1
%
This is
sample fortune 2
%
This fortune
is repeated
%
This is sample fortune 3
%
This fortune
is repeated
%
This fortune
is unique
%
正如你所看到的,命运可以在多行跨越,呈现solutions here没用。
我该怎么做才能找到并消除重复的命运?我想找到一种方法来让awk
忽略以%
开头的行,但有些命运共享相同的行,但总体上并不相同(比如我的例子中的最后两行),所以这还不够。
到目前为止,我一直试图解决这个与awk
,但任何工具都很好。
我不知道'RS'和'ORS'变量。这是我错过的关键。 – SnoringFrog
确实,它们非常强大!我建议总是考虑*记录*而不是*行* – hek2mgl