2016-11-08 67 views
1

我有这样的字符串:比赛连续重叠组,正则表达式

TAACCCTAACCCTAACCCTA 

我可以做

$ echo TAACCCTAACCCTAACCCTA | grep -Eo "[ACGT]{4}" 
TAAC 
CCTA 
ACCC 
TAAC 
CCTA 

但我想:

TAAC 
AACC 
ACCC 
CCCT 
CCTA 
... 
... 

它必须是与不贪婪和向前看或向后看,但我需要一些帮助。

回答

1
echo TAACCCTAACCCTAACCCTA | awk '{while (d++ < length) print substr($0, d, 4)}' 
+0

Thanks!这完全适用于一个变更。需要'length-3'或者最后得到一些存根。我希望有一个正则表达式的解决方案。 – abalter

+0

@abalter为什么在马会使用斑马? –

+0

要了解有关正则表达式的更多信息,可能需要将来使用类似但不同的东西。但很好学习更多的awk,并且你的答案很简单。 – abalter