2017-01-03 68 views
0

我的文件看起来像比赛多发性模式使用awk命令

10.183.227.46|242066391737|73633662;244809|com.com|com.com|2001|CCA-I|0|[29/Dec/2016:00:00:40]|26|RULE_31893406,RULE_31893405,RULE_416241598|4106,4105,4000|2006,2005,5000|0|0|0|0|2621440|3000|-|-|1003:0,1013:0,1010:Home|244809|0|117,115,40|-|-| 

我希望看到包含在第24场1172001在第6场文件

我使用

awk -F "|" '{if($6==2001 && $24==117)print }' 29_DEC_2016.1 

但作为第24场可以包含多个1值逗号分隔 我没有得到正确的结果

+0

是否'117'必须在第24字段的开始,或者它可以是任何任意位置,并且仍然匹配,例如应该匹配115,117,40? –

+0

它可以在任何位置 – Prafull

+0

然后,您接受的答案不适用于您,因为第一个脚本只会查看第一个位置,而第二个脚本会在任何位置查找错误匹配。 –

回答

2

或者使用GNU awksplit功能与,去限制列提取的话,做该值

awk -F "|" '{split($25,array1,","); if ($6 == "2001" && array1[1] == "117"){print} }' file 

检查如果该元素可以在列的任何地方发生,只是一个~正则表达式匹配就足够了。

awk -F "|" '$6 == "2001" && $25 ~ /117/' file 

请参阅此James Brown's answer以获得更加严格的regEx匹配。

+0

没有必要117将是第一个数字 – Prafull

+0

@Prafull:请参考我的更新应该能够解决您的问题 – Inian

+0

谢谢,它工作! :) – Prafull

3
$ awk -F\| '$6=="2001" && $25 ~ /(^|,)117($|,)/' file 

$6等于"2001"(不要只使用2001因为如果你正在寻找0$6==0会失败隐含打印)和$25恰好包括117(preceeded和随后启动的串^或(|字符串尾部或逗号,(为了以防万一,您可以在空间中放置))。

测试后半部分:

$ cat foo 
117,2,3 # good 
1,117,3 # good 
1,2,117 # good 
1117,2,3 # bad 
1,1117,3 # bad 
1,2,1177 # bad 
$ awk '$1~/(^|,)117($|,)/' foo 
117,2,3 # good 
1,117,3 # good 
1,2,117 # good 
+1

++只为regEx – Inian

+1

@Inian显然'/ [,^] /'这样不工作... –

+1

包括对你的答案在我的引用! – Inian

0
awk -F'[|,]' '{print $6,$(NF-5)}' file 

2001 117