下面您将看到从专有路由设备的32b内存转储中字符串'octeon'的一小段匹配摘录。正如你所看到的,它包含一些调整后的ASCII,从行尾延伸到16个字符,然后是四个32位字(当然每个8个字符),然后是地址偏移量。正则表达式仅匹配行尾的X个字符
000b27a0: 41646a75 7374206f 6374656f 6e5f6970 Adjust octeon_ip
000b2850: 73740a00 00000000 6f637465 6f6e5f72 st......octeon_r
000b2870: 5f73697a 65000000 6f637465 6f6e5f72 _size...octeon_r
000b2990: 6164696e 672e0a00 6f637465 6f6e5f72 ading...octeon_r
000b29b0: 785f7369 7a650000 6f637465 6f6e5f72 x_size..octeon_r
000b3050: 780a0000 00000000 6f637465 6f6e5f70 x.......octeon_p
000b3650: 6564204f 6374656f 6e206d6f 64656c0a ed Octeon model.
000bade0: 20307825 71780a00 6f637465 6f6e5f6c 0x%qx..octeon_l
000bafd0: 696e6720 4f637465 6f6e2045 78656375 ing Octeon Execu
000bd710: 6564204f 6374656f 6e204d6f 64656c21 ed Octeon Model!
000bd950: 4f435445 4f4e2070 61737320 3120646f OCTEON pass 1 do
000bda20: 6564206f 6374656f 6e206d6f 64656c3a ed octeon model:
虽然这一数据包含了一些有用的信息,可悲的是,操作系统(HiveOS)没有试图连续分配内存或合并不同的堆(为什么要?),所以绝大多数的记忆是一个贫瘠的尚未成型的堆。
0004d6b0: 00000000 00000000 00000000 00000000 ................
0004d6c0: 00000000 00000000 00000000 00000000 ................
0004d6d0: 00000000 00000000 00000000 00000000 ................
0004d6e0: 00000000 00000000 00000000 00000000 ................
0004d6f0: 00000000 00000000 00000000 00000000 ................
0004d700: 00000000 00000000 00000000 00000000 ................
0004d710: 00000000 00000000 00000000 00000000 ................
0004d720: 00000000 00000000 00000000 00000000 ................
0004d730: 00000000 00000000 00000000 00000000 ................
0004d740: 00000000 00000000 00000000 00000000 ................
0004d750: 00000000 00000000 00000000 00000000 ................
我想快速,高效地拔出匹配一些任意的正则表达式模式具有一定规模的字符串([a-zA-z]
想到) 你自然会认为运行常年对象转储检查最喜欢的“弦”会产生一个结果,但md
util是一个残酷的情妇 - 由于存在ascii编码的十六进制银行&地址,它将每一行标识为包含“字符串”。
当然,我们都知道存在一个简单的脚本解决方案(for line in hexdump: f.write(line[-16:])
+ grep '[A-z]' f
)。
但是,有时候我会觉得我应该理解这些卑鄙的压迫,但是更好地理解了正则表达式,而不是回到易于使用的新颖编程语言。我真的觉得我无法开始发展真正的Unix领袖,直到我用各种流编辑器和Awk脚本的正则表达式完全替代了我的整个
开发工具链
生活。
如何匹配[a-zA-z]
从行尾的一定数量的字符(在我的情况下,16) - 它看起来像一个漂亮精巧的建筑,但+,?的所有组合。 {16}以及在过去几分钟内对我有意义的事情已经及时地失败了。
也许我错误地理解了这个请求。你想获得每行的最后16个字符,或*只从最后16个字符中提取字母*? – TLS 2012-03-15 17:40:53