好像你可以只是评估字符串,然后从那里摘掉类型:
>>> items = ast.literal_eval('(404.5, "Hello", 5)')
>>> [{'type': type(item).__name__, 'value': item} for item in items]
[{'type': 'float', 'value': 404.5}, {'type': 'str', 'value': 'Hello'}, {'type': 'int', 'value': 5}]
当然,如果你想做更多有趣的事情,你可以访问AST di rectly:
>>> ast.dump(ast.parse('(404.5, "Hello", 5)'))
"Module(body=[Expr(value=Tuple(elts=[Num(n=404.5), Str(s='Hello'), Num(n=5)], ctx=Load()))])"
>>> ast.parse('(404.5, "Hello", 5)').body[0].value.elts
[<_ast.Num object at 0x107fa1250>, <_ast.Str object at 0x107fa1290>, <_ast.Num object at 0x107fa12d0>]
对于除解析一个元组(如你加入到这个问题),我们仍然可以使用Python的AST解析这个更一般的事情(只要你的语法是有效的Python) 。在这种情况下,我们将创建一个ast.NodeVisitor
,它将提取我们在访问我们关心的Python AST的每个节点时的信息。在这种情况下,我们关心Call
,Num
,Str
和Name
节点:
import ast
class Parser(ast.NodeVisitor):
def __init__(self):
self.calls = []
self.current_command = None
def visit_Call(self, node):
name = node.func.id
self.current_command = {
'type': 'command',
'name': name,
'args': []
}
self.calls.append(self.current_command)
for arg in node.args:
self.visit(arg)
self.current_command = None
def visit_Num(self, node):
if not self.current_command:
return
args = self.current_command['args']
arg = {
'type': type(node.n).__name__,
'value': node.n
}
args.append(arg)
def visit_Str(self, node):
if not self.current_command:
return
args = self.current_command['args']
arg = {
'type': 'str',
'value': node.s
}
args.append(arg)
def visit_Name(self, node):
if not self.current_command:
return
args = self.current_command['args']
arg = {
'type': 'type',
'kind': node.id
}
args.append(arg)
S = 'commandName(3, "hello", 5.0, int)'
tree = ast.parse(S)
p = Parser()
p.visit(tree)
print p.calls
我要澄清:元组显示为一个字符串,是一个较大的字符串,通常是一个命令如“加(1的一部分,”你好“,3)' – TheSeamau5
我认为唯一剩下的就是问什么是_rules_来决定什么是事情。例如说“int”是“类型”的规则是什么?它是否与Python标识符一样解析?和命令只是后面有()的标识符?在这种情况下,你仍然可以使用'AST'来解析这个(这很有趣)。 – mgilson
好问题。我刚刚更新我的示例稍微复杂一些。我用“变量”替换“类型”。你会看到现在的语法不再是Python了。重点是我稍后将添加此命令可以接受的不同类型的数据,并且其语法不应与Python的语法绑定。 – TheSeamau5