2016-11-25 76 views
0

我写了bash脚本来计算文件的哈希值,当它给出文件路径并查询文件哈希中的一个以从API服务获取该哈希的结果时(使用jq解析)。速率限制bash脚本提供的cURL请求的数量

#Scanner.sh 

#!/bin/bash 

for i in $(find $1 -type f);do 
    md5_checksum=$(md5sum $i|cut -d' ' -f 1) 
    sha1_checksum=$(sha1sum $i|cut -d' ' -f 1) 
    sha256_checksum=$(sha256sum $i|cut -d' ' -f 1) 
    json_result="$(curl --silent -H 'Authorization:Basic XXXX' 'https://XXXXX.com/api/databrowser/malware_presence/query/sha1/'$sha1_checksum'?format=json&extended=true'| jq -r '.rl.malware_presence.name,.rl.malware_presence.level' | awk -vORS=, '{print $1}' |sed 's/,$/\n/')" 
    echo "$md5_checksum,$sha1_checksum,$sha256_checksum,$json_result" 
done 


#Result : 
c63a1576e4b416e6944a1c39dbdfc3b4,fd55dfdd9a432e34ce6c593cd09a48f457f7aab6,e2d1c1975c2406f60f1c0fe5255560c2cd06434e669933536a86296a2eb70020,Malware,5 

现在,处理一个并获得一个文件散列(10秒)的结果需要太多的时间。我如何每秒发送5个请求并更快地获得结果?

任何建议吗?

回答

1

你可以把你的代码的功能,并在后台运行,像这样的东西:

runCurl() { 
     md5_checksum=$(md5sum $1|cut -d' ' -f 1) 
     sha1_checksum=$(sha1sum $1|cut -d' ' -f 1) 
     sha256_checksum=$(sha256sum $1|cut -d' ' -f 1) 
     json_result="$(curl --silent -H 'Authorization:Basic XXXX' 'https://XXXXX.com/api/databrowser/malware_presence/query/sha1/'$sha1_checksum'?format=json&extended=true'| jq -r '.rl.malware_presence.name,.rl.malware_presence.level' | awk -vORS=, '{print $1}' |sed 's/,$/\n/')" 
     echo "$md5_checksum,$sha1_checksum,$sha256_checksum,$json_result" 
    } 

    for i in $(find $1 -type f);do 
     runCurl $i & 
    done 
+0

谢谢,这工作。但使用“&”可能会启动多个请求。这可能会轰炸API服务服务器。我如何评价限制?例如,每分钟有50个查询? – Arun

+0

您可以使用'wait'命令等待当前后台任务完成。所以也许你可以每5次请求使用这个命令。 –