2017-08-01 209 views
1

我有值的字典:如何根据部分字符串匹配过滤字典?

dic = {1: "a1+b+c", 2: "a1+c+v", 3: "a1+z+e", 4: "a2+p+a", 5: "a2+z+v", 6: "a3+q+v", ...} 

我在烧瓶内的页面,其具有用于每个部分的字符串值复选框在字典中,例如复选框“A”,“B”,“C”,...等等在页面上,该复选框位于组A1,A2,A3等

我需要的部分值来过滤词典基于所选择的复选框的值,例如,A1组中选择的“c”时,它会返回:

1: a1+b+c 
2: a1+c+v 

当从组A2中选择的“Z”,它将返回:

5: "a2+z+v" 

,其产生错误的代码是:

sol = [k for k in dic if 'a1' in k] 

有人能指点我正确的方向吗?

回答

1

您可以轻松地用很短的功能解决这个问题:

def lookup(dct, *args): 
    for needle in args: 
     dct = {key: value for key, value in dct.items() if needle in value} 
    return dct 

例如:

>>> dic = {1: "a1+b+c", 2: "a1+c+v", 3: "a1+z+e", 4: "a2+p+a", 5: "a2+z+v", 6: "a3+q+v"} 
>>> lookup(dic, "a1", "c") 
{1: 'a1+b+c', 2: 'a1+c+v'} 

但是总是需要遍历所有键为每个“针”。你可以做的更好,如果你有一个辅助字典(我会在这里使用一个collections.defaultdict)存储匹配一个针,所有的键(假设+应该是在你的字典中的分隔符):

from collections import defaultdict 

helperdict = defaultdict(set) 
for key, value in dic.items(): 
    for needle in value.split('+'): 
     helperdict[needle].add(key) 

helperdict现在包含匹配值的一个特定组成部分,所有的按键:

>>> print(dict(helperdict)) 
{'z': {3, 5}, 'p': {4}, 'a1': {1, 2, 3}, 'a3': {6}, 'v': {2, 5, 6}, 'a2': {4, 5}, 'e': {3}, 'b': {1}, 'a': {4}, 'c': {1, 2}, 'q': {6}} 

而且使用set.intersection可以让你快速获得所有比赛的不同组合:

>>> search = ['a2', 'z'] 
>>> matches = set.intersection(*[helperdict[needle] for needle in search]) 
>>> {match: dic[match] for match in matches} 
{5: 'a2+z+v'} 

这绝对大于第一种方法,需要更多的外部存储器,但如果你打算做几个查询会快很多。