2013-10-24 62 views
0

我有一个带有换行符或回车符的大文件。该文件来自HTML,我除去了要转换为换行符(/ n)的所有标签。使用AWK或SED执行此操作的快速而简单的方法是什么?我想AWKSED也是一种选择。使用awk或sed替换带有换行符的HTML标记

+0

告诉我,没有真正名为'AWKSED'的东西!发布一些示例输入和预期输出。 –

回答

0

像这样的东西应该工作:

sed 's/<[^>]*>/\n/g' file 

这意味着:更换开始<所有文字,其次是不>字符数目不详,并且与>结束,有一个换行符。

+0

因此,如果我把/ tr放在括号中,它应该用换行符替换所有出现的标记? –

+0

是的,由于'g'命令,并且因为'[^>]'做了一个非贪婪的匹配,所以这会更新所有与换行符相关的事件。 – user000001

+0

我对你的修改有点困惑。如果标签是/ tr,那么我的解决方案中用/ tr替换了什么? ^>或者*? –