我有一个CSV像这样行文件:SED或AWK - 图案之间删除字符串
AAA,A-name,num1,num2,num3
BBB,B-name,num1,num2,num3
CCC.DDD,C-name,num1,num2,num3
EEE.FFF.GGGG,E-name,num1,num2,num3
HHH.H-name,num1,num2,num3
...
一些线具有一个标识符(如AAA);有的有两个(如CCC);一些有三个或更多(如EEE)。而一些标识符不是三个字符。我需要从该行的每一行删除所有,但第一标识符(使得第一期和任何被删除后,遇到的第一个逗号,直到自带),生产这种:
AAA,A-name,num1,num2,num3
BBB,B-name,num1,num2,num3
CCC,C-name,num1,num2,num3
EEE,E-name,num1,num2,num3
HHH,H-name,num1,num2,num3
...
我已经尝试了一些模式替换方法,但是被绊倒了。有没有人有我需要的语法?
我认为你的HHH线有问题。第一段不应该是逗号吗? “三个或更多”不应该指EEE而不是HHH? – 2011-06-16 13:41:57