2013-04-30 84 views
2

我有一个大文件,其中有几行,如下所示。我只想读入那些在其中具有_INIT模式的行,然后剥离名称中的_INIT并仅将OSD_MODE_15_H部分保存在变量中。然后我需要读取相应的十六进制值,在这种情况下,8'h00,并从中取出8'h,并将其替换为0x并保存在变量中。 我一直试图剥离_INIT,空格和=,代码变得非常混乱。将文件中的行拆分为字符串和十六进制,并对十六进制值进行操作

localparam OSD_MODE_15_H_ADDR = 16'h038d; 
localparam OSD_MODE_15_H_INIT = 8'h00 

你可以建议一个精益和干净的方法来做到这一点?

谢谢!

+0

您是否尝试过使用正则表达式或手动删除“asfd”.replace()和朋友的部件? – 2013-04-30 21:29:21

回答

2

以下解决方案使用正则表达式(编译,以加快搜索上)相匹配的相关线路,并提取所需的信息。该表达式使用命名组“id”和“hexValue”来标识要从匹配行中提取的数据。

import re 

expression = "(?P<id>\w+?)_INIT\s*?=.*?'h(?P<hexValue>[0-9a-fA-F]*)" 
regex = re.compile(expression) 

def getIdAndValueFromInitLine(line): 
    mm = regex.search(line) 
    if mm == None: 
    return None # Not the ..._INIT parameter or line was empty or other mismatch happened 
    else: 
    return (mm.groupdict()["id"], "0x" + mm.groupdict()["hexValue"]) 

编辑:如果我理解正确的下一个任务,你需要找到那些INIT的hexvalues和ADDR行其ID匹配,使INIT hexvalue的字典到ADDR hexvalue。

regex = "(?P<init_id>\w+?)_INIT\s*?=.*?'h(?P<initValue>[0-9a-fA-F]*)" 
init_dict = {} 
for x in re.findall(regex, lines): 
    init_dict[x.groupdict()["init_id"]] = "0x" + x.groupdict()["initValue"] 

regex = "(?P<addr_id>\w+?)_ADDR\s*?=.*?'h(?P<addrValue>[0-9a-fA-F]*)" 
addr_dict = {} 
for y in re.findall(regex, lines): 
    addr_dict[y.groupdict()["addr_id"]] = "0x" + y.groupdict()["addrValue"] 

init_to_addr_hexvalue_dict = {init_dict[x] : addr_dict[x] for x in init_dict.keys() if x in addr_dict} 

即使这不是你真正需要的,使用init和addr字典可能有助于更容易地实现目标。如果有多个_INIT(或_ADDR)行具有相同的ID和不同的hexvalues,那么上述字典方法将无法以直接的方式工作。

+2

您的最终捕获将包含示例中第一行的分号。 另外,我认为命名捕获组在保持正则表达式可读性方面有很多帮助。 – 2013-04-30 22:00:25

+0

将代码编辑为仅包含最后一组中的十六进制数字。 – astraujums 2013-04-30 22:10:15

+1

你正在匹配第一组中的localparam部分 – 2013-04-30 22:21:17

1

尝试像这个 - 不知道你所有的要求,但是这应该让你接近:

with open(someFile, 'r') as infile: 
    for line in infile: 
     if '_INIT' in line: 
      apostropheIndex = line.find("'h") 
      clean_hex = '0x' + line[apostropheIndex + 2:] 

在的情况下,“16'h038d;” clean_hex将是“0x038d;” (需要删除“;”不知何故),在“8'h00”的情况下,clean_hex将是“0x00”

编辑:如果你想防止像“;”你能做到这一点,测试,如果是字母数字字符:

clean_hex = '0x' + ''.join([s for s in line[apostropheIndex + 2:] if s.isalnum()]) 
1

您可以使用正则表达式和re.findall()函数。例如,用你想要的数据生成元组列表:

import re 
lines = open("your_file").read() 
regex = "([\w]+?)_INIT\s*=\s*\d+'h([\da-fA-F]*)" 
res = [(x[0], "0x"+x[1]) for x in re.findall(regex, lines)] 
print res 

正则表达式对于你的输入例子是非常具体的。如果文件中的其他行略有不同,您可能需要稍微修改一下。