获得最大的价值我有一个看起来像这样的制表符分隔的fileA:的bash/awk的:每个细胞
seqnameAa_len_240 seqnameBa_len_247
seqnameAb_len_881 seqnameBb_len_719
seqnameAc_len_736,seqnameAd_len_640 seqnameBc_len_489
seqnameAe_len_241 seqnameBd_len_302,seqnameBe_len_465
seqnameAf_len_436,seqnameAf_len_620 seqnameBf_len_452,seqnameBg_len_435
序列左边是从一个数据集和序列从右边是从另一个。每一行反映了一组相似的序列。在某些情况下,属于同一序列组的一个,另一个或两个数据集有多个序列(反映在一列中用逗号分隔的几个序列中)。
对于每一行,我想找到一种方法来找到两个数据集中每个数据集的最大值,并给出以下输出。
240 247
881 719
736 489
241 465
620 452
我想过做一个for循环在所有的行,然后对每行以换行符替换逗号,然后删除所有的文本,并只保留号码,并选择每列使用awk的最大值。但是用我现在的bash/awk知识必须按列方式完成,并且每个单元没有一定数量的逗号分隔条目,我不知道该怎么做。
是否有一种更简单的方式从fileA获取上述输出?
不要犹豫,尝试自己编码并显示你的尝试。否则,你很可能会习惯于完成任务,当你需要自己完成任务时,你将不会学到任何东西。 – fedorqui 2015-02-24 15:30:38