2016-08-02 176 views
2

我正在研究一些代码优化,我会检查我的函数的大小,而不是读取巨大的反汇编文件。在Debug上编译后,我使用nm命令读取.o。我们拿到的这款:使用awk解析nm命令的输出 - Linux Bash

nm --size-sort $OBJFILEPATH.o 

000000000000000b r __PRETTY_FUNCTION__.6473 
0000000000000017 t extract_h 
0000000000000036 t L_mult 
000000000000003a t sature32 
0000000000000042 t L_mac 
0000000000000048 t L_add 
000000000000005c t Mac16x11 
0000000000000077 t L_shl 
0000000000000083 t L_shr 
00000000000000df T G729Convolve 
0000000000000114 T G729Residu 
00000000000001bc T G729Syn_filt_L_H 
00000000000001bc T G729Syn_filt_L_SUBFR 

如今,走进一个bash脚本,我想解析只有第1列至极每一行代表在bash单个数组元素。

我的命令是:

read FUNCSIZE <<< $(nm --size-sort $OBJFILEPATH.o | awk '{print $1}') 

并为确保一切正常检查我FUNCSIZE数组的大小。

SIZE=${#FUNCSIZE[@]} 
echo size is $SIZE 
for s in $FUNCSIZE 
do 
    echo $s 
done 

我得到这个作为输出:

size is 1 
000000000000000b 
0000000000000017 
0000000000000036 
000000000000003a 
0000000000000042 
0000000000000048 
000000000000005c 
0000000000000077 
0000000000000083 
00000000000000df 
0000000000000114 
00000000000001bc 
00000000000001bc 

为什么大小是“1”,为什么我能打印每个元素就像是一个数组里面。看起来输出结果仍然有一个“空间”。是否有任何RegEx与awk,将避免将分隔符字段包含到数组中?

感谢您的帮助!

编辑答案

read -a FUNCSIZE <<< $(nm --size-sort $OBJFILEPATH.o | awk '{print $1}') 
SIZE=${#FUNCSIZE[*]} 
for((i=0; i<SIZE; i++)) 
do 
    echo ${FUNCSIZE[$i]} 
done 
+2

您正在读取标量,而不是数组。也许你打算使用'read -a'。无论如何,创建一个bash数组可能是你接下来要做的任何事情的错误起点 - 如果你用一个简明,可测试的例子告诉我们,我们可以帮助你。 –

+0

我们想制作一个工具来比较两个不同的.o文件,并且比较任何函数是否已经及时更改。将大小解析为变量将使脚本能够检查特定功能是否比以前更大。 –

+0

这将是一个awk脚本,所以从2个shell数组开始并不会有用。一个shell只是一个环境,通过它可以调用具有语言的工具来对这些调用进行排序,而标准的通用UNIX工具来处理文本是awk。 –

回答

1

这听起来这样从您的评论可能是你真正寻找:

$ cat tst.awk 
{ 
    size = strtonum("0x"$1) 
    sub(/^([^[:space:]]+[[:space:]]+){2}/,"") 
    name = $0 
} 
NR==FNR { oldSize[name] = size; next } 
{ 
    newSize[name] = size 
    if (name in oldSize) { 
     if (oldSize[name] < newSize[name]) { 
      bigger[name] 
     } 
     else if (oldSize[name] > newSize[name]) { 
      smaller[name] 
     } 
    } 
    else { 
     added[name] 
    } 
} 
END { 
    print "Got bigger:" 
    for (name in bigger) print "\t" name, oldSize[name], "->", newSize[name] 

    print "Got smaller:" 
    for (name in smaller) print "\t" name, oldSize[name], "->", newSize[name] 

    print "Added:" 
    for (name in added) print "\t" name 

    print "Deleted:" 
    for (name in oldSize) if (!(name in newSize)) print "\t" name 
} 

$ gawk -f tst.awk <(cat file1) <(cat file2) 
Got bigger: 
    Mac16x11 92 -> 93 
Got smaller: 
    L_mac 66 -> 65 
Added: 
    extract_h 
Deleted: 
    G729Residu 

上面使用GNU AWK为strtonum(),并在这些2输入文件运行:

$ cat file1 
000000000000000b r __PRETTY_FUNCTION__.6473 
0000000000000036 t L_mult 
000000000000003a t sature32 
0000000000000042 t L_mac 
0000000000000048 t L_add 
000000000000005c t Mac16x11 
0000000000000077 t L_shl 
0000000000000083 t L_shr 
00000000000000df T G729Convolve 
0000000000000114 T G729Residu 
00000000000001bc T G729Syn_filt_L_H 
00000000000001bc T G729Syn_filt_L_SUBFR 

$ cat file2 
000000000000000b r __PRETTY_FUNCTION__.6473 
0000000000000017 t extract_h 
0000000000000036 t L_mult 
000000000000003a t sature32 
0000000000000041 t L_mac 
0000000000000048 t L_add 
000000000000005d t Mac16x11 
0000000000000077 t L_shl 
0000000000000083 t L_shr 
00000000000000df T G729Convolve 
00000000000001bc T G729Syn_filt_L_H 
00000000000001bc T G729Syn_filt_L_SUBFR 

只要与相应nm ...替换每个cat file

+1

Awesome Ed Morton! –

2

你写它的方式之后,FUNCSIZE不是一个数组,而是一个普通的变量。

添加-a标志read

read -a FUNCSIZE <<< $(nm --size-sort $OBJFILEPATH.o | awk '{print $1}') 

注意,使用用户定义的变量全部大写的名称是不建议,要avoid conflicts (and confusion) with environmental variables and special shell variables

(!感谢@mklement0的提示和链接)

+1

谢谢janos和Ed Morton。 -a标志是我正在寻找的答案! –

+1

我建议要么根本不显示'FUNCSIZE =($(...))'选项,要么将其称为反模式,因为它会使命令替换的输出受制于(通常不需要的)globbing(尝试' a =($(echo'*'))'。也值得推荐不要使用全大写变量名,并且常规地将'-r'选项添加到'read'。 – mklement0

+1

@ mklement0好点,谢谢,更新我的帖子。 – janos