我的CSV文件有一个像检查正是第N个符号由逗号
start_time,end_time,link
1407233497,1407233514,http://s.youtube.com/stream_204?event=streamingstats&fmt=n
1407233498,1407233515,http://s.youtube.com/stream_204?event=cenjreaecnjcd
mingstats&fmt=n
1407233499,1407233516,http://s.youtube.com/stream_204?event=weedwcecd
有些时候链接包含新线列,我想删除它们。我怎样才能做到这一点从这样最后输出的新行变为:
1407233497,1407233514,http://s.youtube.com/stream_204?event=streamingstats&fmt=n
1407233498,1407233515,http://s.youtube.com/stream_204?event=cenjreaecnjcdmingstats&fmt=n
1407233499,1407233516,http://s.youtube.com/stream_204?event=weedwcecd
我这个AWK一个班轮建议:
awk '{printf "%s%s", (NR>1&&/^[0-9]{10}/?"\n":""),$0}END{print ""}' file
它的伟大工程,但可能它会检查第10个符号是否逗号更快?
换行字符可能只是内部链接和链接不能包含逗号
我会很感激的帮助
我猜测你所拥有的'awk'会比需要计数''的''更快,以获得新的行。这里每行只有两个','。 – Jotne 2014-08-31 10:18:37
所以你有一个awk工作程序,你想要什么,一个更快的?如果这是一个性能优化问题,则应包括样本输入,当前时间和目标时间。 – 2014-08-31 10:20:12
@hash你的意思是在链接部分可能有多个换行符? – 2014-08-31 10:20:18