2010-01-16 97 views
18

我想从用户输入的文本中提取信息。想象一下,我输入以下内容:从引号之间提取字符串

SetVariables "a" "b" "c" 

我将如何提取第一组报价之间的信息?那第二个?那么第三个?

回答

26
>>> import re 
>>> re.findall('"([^"]*)"', 'SetVariables "a" "b" "c" ') 
['a', 'b', 'c'] 
+0

是否需要在行尾加上分号? – User 2014-03-14 18:16:56

+0

@jspcal这是否也适用于单引号? – 2015-05-21 22:28:08

9

Regular expressions这是好的:

import re 
quoted = re.compile('"[^"]*"') 
for value in quoted.findall(userInputtedText): 
    print value 
20

你可以在上面做一个string.split()。如果字符串使用引号(即偶数引号)正确格式化,则列表中的每个奇数值都将包含引号之间的元素。

>>> s = 'SetVariables "a" "b" "c"'; 
>>> l = s.split('"')[1::2]; # the [1::2] is a slicing which extracts odd values 
>>> print l; 
['a', 'b', 'c'] 
>>> print l[2]; # to show you how to extract individual items from output 
c 

这也比正则表达式更快的方法。使用timeit模块,此代码的速度大约快4倍:

% python timeit.py -s 'import re' 're.findall("\"([^\"]*)\"", "SetVariables \"a\" \"b\" \"c\" ")' 
1000000 loops, best of 3: 2.37 usec per loop 

% python timeit.py '"SetVariables \"a\" \"b\" \"c\"".split("\"")[1::2];' 
1000000 loops, best of 3: 0.569 usec per loop 
相关问题