AWK文本处理CVS文件

我有很多的大*将该.cvs文本文件看起来像这样：AWK文本处理CVS文件

Word,Tag,Lemma 
    Off,aa,off 
    short,aa,short 
    and,sfg3eþ,and 
    tall,sþghen,tall 
    deers,aþ,deer 
    in,never,in 
    Africa,nc,Africa 
    frv.,aa,frv. 
    ---,ta,--- 
    ,, 
    All,nhfn,all 
    allowed,lhfnsf,allow 
    personell,c,personell 
    aggr.,lheþsf,aggr. 
    with,aþ,with 
    23,ta,23 
    as.,nvfn,as. 
    sillable.,lheþsf,sillable. 
    ,, 
    Á,aþ,á

我需要处理该文件，使得第一列放在像列表这样的：

{[Off short and tall deers in Africa frv],[All allowed personnel aggr. with 23 as syllable.],[Á......],...n]}

在最后，需要有一个：]}

我曾尝试：

awk 'BEGIN {FS=",";print"{["} /",,"/ {print"],["} END {print"]}"}' 079.cvs

刚刚打印： {[ ]}

我也发现了这一点：

cat 080.csv | cut -d ',' -f3 >>D.txt

这实际上是非常有用的：

Off 
    short 
    and 
    tall 
    ....

但实际上是 “深”文件并缺少列表元素。

来源

2015-11-08 user2446141

这不是很好的取消接受的答案，能删除你的问题。如果你使用我的帮助，请保持礼貌。看到你删除的问题：[制作数字序列]（https://stackoverflow.com/q/36344915/1983854）。 – fedorqui

更新

awk -F, 'NR==1{printf "{["; next} /^--/||!$1{if(a)printf "],["; a=0; next} {printf "%s ",$1; a=1} END{printf "]}"}' file 
{[Off short and tall deers in Africa frv. ],[All allowed personell aggr. with 23 as. sillable. ],[Á ]}

来源

2015-11-08 11:09:01 bian

这是非常好的，它打印出文件的最大部分，但以此结束：awk：奇怪的printf转换％输入记录号1303，文件079.csv 源代码行号1 awk：printf中没有足够的参数（20 ％）输入记录编号1303，文件079.csv 源代码行号1 – user2446141

您检查079.csv 1303行吗？ – bian

我之前在评论中忽略了最大的一项。是的，它处理第一个1303行。该文件有331765行。 – user2446141

AWK文本处理CVS文件

回答

相关问题