2011-07-26 64 views
1

Tshark是一个命令行数据包嗅探器。我试图找到一种方法来从数据包中获取信息,将其放入一个变量中并对其进行一些正则表达式。从Tshark捕获数据

现在,我从tshark的得到这个:

Capturing on eth0 
    0.000000 74.125.71.116 -> 112.204.184.111 TCP http > 55828 [ACK] Seq=1 Ack=1 Win=6434 Len=0 TSV=2558834852 TSER=542043 
    0.000035 112.204.184.111 -> 74.125.71.116 HTTP Continuation or non-HTTP traffic 
    0.000043 112.204.184.111 -> 74.125.71.116 HTTP Continuation or non-HTTP traffic 

注:我使用的红宝石。

+0

你想提取什么样的信息?你在做什么(使用正则表达式)? – 2011-07-26 22:29:45

+0

我正在寻找获取视频的网址,例如来自视频网站的.flv,mp4,m4v文件等。 –

回答

0

你既可以管这个数据到一个文件,然后打开并使用Ruby解析,或者你可以使用一个Ruby的lib可以访问相同的数据,如:http://sourceforge.net/apps/trac/rubypcap/

+0

如何将数据传输到文件中? –

+0

'tshark -R http.request.full_uri -T fields -e http.request.full_uri >> output.txt' –

3

您可以使用tshark本身不另一个工具。从分组此命令打印出所有的URI,他们到达:

$ tshark -R http.request.full_uri -T fields -e http.request.full_uri -i en0 

您可以细化display filter(在-R参数),以更好地满足您的要求。 它甚至还支持Perl的正则表达式匹配:从来访

# Mac OS X 
$ tshark -R 'http.request.full_uri matches "\\.jpg\|\\.js"' -T fields -e http.request.full_uri -i en0 

示例输出youtube.com:

$ tshark -R 'http.request.full_uri matches "\\.jpg\|\\.js"' -T fields -e http.request.full_uri -i en0 
Capturing on en0 

http://s.ytimg.com/yt/jsbin/www-core-vfl3_mVgh.js 
http://s.ytimg.com/yt/jsbin/www-subscriptions-vfl5HwfxW.js 
http://i2.ytimg.com/i/QMbqH7xJu5aTAPQ9y_U7WQ/1.jpg?v=95416b 
http://i1.ytimg.com/vi/4R0BAjrZqyY/default.jpg 
http://i4.ytimg.com/i/KVtW8ExxO21F2sNLtwrq_w/1.jpg?v=a1fa0c 
http://i3.ytimg.com/vi/z3U0udLH974/default.jpg 
http://i2.ytimg.com/vi/arKyyDRsE_8/default.jpg 
http://i2.ytimg.com/vi/y1TGz-fEyiE/default.jpg 
http://i2.ytimg.com/vi/-tc983PZK3o/default.jpg 
http://i2.ytimg.com/vi/1yT2rrTyMK8/default.jpg 
http://i4.ytimg.com/vi/cciUXpITsu0/default.jpg 
http://i2.ytimg.com/vi/uG0dimAxHpI/default.jpg 
http://i2.ytimg.com/vi/eP9P50kbzTk/default.jpg 
http://i1.ytimg.com/vi/ppBe0T412uU/default.jpg 
http://i1.ytimg.com/vi/8360wVLtEuk/default.jpg 
http://i4.ytimg.com/vi/G_yB7wdTxa0/default.jpg 
http://i4.ytimg.com/vi/gcZxoLs3NIU/default.jpg 
http://i1.ytimg.com/i/po2fJvnalYlwN97ehhyfBQ/1.jpg?v=b8e52a 
http://i1.ytimg.com/vi/D2Xjj_ra8lQ/default.jpg 
http://i1.ytimg.com/vi/PewewGu9gp8/default.jpg 
http://i1.ytimg.com/vi/P9FkRD6ppGo/default.jpg 
http://i3.ytimg.com/vi/vpZ4SMU4znQ/default.jpg 
http://i3.ytimg.com/vi/jrrSGulNOLc/default.jpg 
http://i3.ytimg.com/vi/FJtTzQfdnoQ/default.jpg 
http://i3.ytimg.com/vi/68sEHPpQXes/default.jpg 
http://i2.ytimg.com/vi/iWYqsaJk_U8/default.jpg 
http://i4.ytimg.com/vi/7Prb8DbdfwY/default.jpg 
http://i1.ytimg.com/vi/HJFlxLJSX8E/default.jpg 
http://i1.ytimg.com/vi/ta6Vu_v7VLg/default.jpg 
http://i1.ytimg.com/vi/Hq7NtDSIErE/default.jpg 
http://i4.ytimg.com/vi/Sjdj7qhcTuw/default.jpg 
http://i3.ytimg.com/vi/Nm3Acf3_oMY/default.jpg 
http://i3.ytimg.com/vi/BpsrThXh_gM/default.jpg 
http://i3.ytimg.com/vi/Z3yapgewktY/default.jpg 
http://i3.ytimg.com/vi/2UFc1pr2yUU/default.jpg 
http://i2.ytimg.com/vi/q_Bt6NwD4FY/default.jpg 
http://i2.ytimg.com/vi/uTAAlzABzBA/default.jpg 
http://i2.ytimg.com/vi/iRLUY6dMF8k/default.jpg 
http://i2.ytimg.com/vi/-cDH6CYzTAw/default.jpg 
http://i1.ytimg.com/vi/8p6Fn8R1Rc4/default.jpg 
http://i1.ytimg.com/vi/T8gDQWdlW6A/default.jpg 
http://i2.ytimg.com/vi/ERTcZV7uTFU/default.jpg 
http://i1.ytimg.com/vi/PyxgwA6PvnI/default.jpg 
http://i1.ytimg.com/vi/xUGlezOCvu4/default.jpg 
http://i1.ytimg.com/vi/Ljb6Mne8Mfc/default.jpg 

注:在Windows中,我见过tshark打印所有URI在特定的分组在一行中没有分隔符(例如,"http://www.google.comhttp://www.google.com/logos/classicplus.png")。只有一些数据包受此影响。