将文件中的行拆分为字符串和十六进制，并对十六进制值进行操作

我有一个大文件，其中有几行，如下所示。我只想读入那些在其中具有_INIT模式的行，然后剥离名称中的_INIT并仅将OSD_MODE_15_H部分保存在变量中。然后我需要读取相应的十六进制值，在这种情况下，8'h00，并从中取出8'h，并将其替换为0x并保存在变量中。我一直试图剥离_INIT，空格和=，代码变得非常混乱。将文件中的行拆分为字符串和十六进制，并对十六进制值进行操作

localparam OSD_MODE_15_H_ADDR = 16'h038d; 
localparam OSD_MODE_15_H_INIT = 8'h00

你可以建议一个精益和干净的方法来做到这一点？

谢谢！

来源

2013-04-30 serendipity

您是否尝试过使用正则表达式或手动删除“asfd”.replace（）和朋友的部件？ – 2013-04-30 21:29:21

以下解决方案使用正则表达式（编译，以加快搜索上）相匹配的相关线路，并提取所需的信息。该表达式使用命名组“id”和“hexValue”来标识要从匹配行中提取的数据。

import re 

expression = "(?P<id>\w+?)_INIT\s*?=.*?'h(?P<hexValue>[0-9a-fA-F]*)" 
regex = re.compile(expression) 

def getIdAndValueFromInitLine(line): 
    mm = regex.search(line) 
    if mm == None: 
    return None # Not the ..._INIT parameter or line was empty or other mismatch happened 
    else: 
    return (mm.groupdict()["id"], "0x" + mm.groupdict()["hexValue"])

编辑：如果我理解正确的下一个任务，你需要找到那些INIT的hexvalues和ADDR行其ID匹配，使INIT hexvalue的字典到ADDR hexvalue。

regex = "(?P<init_id>\w+?)_INIT\s*?=.*?'h(?P<initValue>[0-9a-fA-F]*)" 
init_dict = {} 
for x in re.findall(regex, lines): 
    init_dict[x.groupdict()["init_id"]] = "0x" + x.groupdict()["initValue"] 

regex = "(?P<addr_id>\w+?)_ADDR\s*?=.*?'h(?P<addrValue>[0-9a-fA-F]*)" 
addr_dict = {} 
for y in re.findall(regex, lines): 
    addr_dict[y.groupdict()["addr_id"]] = "0x" + y.groupdict()["addrValue"] 

init_to_addr_hexvalue_dict = {init_dict[x] : addr_dict[x] for x in init_dict.keys() if x in addr_dict}

即使这不是你真正需要的，使用init和addr字典可能有助于更容易地实现目标。如果有多个_INIT（或_ADDR）行具有相同的ID和不同的hexvalues，那么上述字典方法将无法以直接的方式工作。

来源

2013-04-30 21:56:53 astraujums

您的最终捕获将包含示例中第一行的分号。另外，我认为命名捕获组在保持正则表达式可读性方面有很多帮助。 – 2013-04-30 22:00:25

将代码编辑为仅包含最后一组中的十六进制数字。 – astraujums 2013-04-30 22:10:15

你正在匹配第一组中的localparam部分 – 2013-04-30 22:21:17

尝试像这个 - 不知道你所有的要求，但是这应该让你接近：

with open(someFile, 'r') as infile: 
    for line in infile: 
     if '_INIT' in line: 
      apostropheIndex = line.find("'h") 
      clean_hex = '0x' + line[apostropheIndex + 2:]

在的情况下，“16'h038d;” clean_hex将是“0x038d;” （需要删除“;”不知何故），在“8'h00”的情况下，clean_hex将是“0x00”

编辑：如果你想防止像“;”你能做到这一点，测试，如果是字母数字字符：

clean_hex = '0x' + ''.join([s for s in line[apostropheIndex + 2:] if s.isalnum()])

来源

2013-04-30 21:37:46 mdscruggs

您可以使用正则表达式和re.findall()函数。例如，用你想要的数据生成元组列表：

import re 
lines = open("your_file").read() 
regex = "([\w]+?)_INIT\s*=\s*\d+'h([\da-fA-F]*)" 
res = [(x[0], "0x"+x[1]) for x in re.findall(regex, lines)] 
print res

正则表达式对于你的输入例子是非常具体的。如果文件中的其他行略有不同，您可能需要稍微修改一下。

来源

2013-04-30 22:33:26 fog

将文件中的行拆分为字符串和十六进制，并对十六进制值进行操作

回答

相关问题