2017-02-09 93 views
0

我想要获取字符串的所有子序列。例如: -查找大字符串的子序列

firstString = "ABCD" 

O/P应该是;

'ABCD', 'BCD', 'ACD', 'ABD', 'ABC', 'CD', 'BD', 'BC', 'AD', 'AC', 'AB', 'D', 'C', 'B', 'A' 

对于我使用下面的代码部分: -

#!usr/bin/python 

from __future__ import print_function 
from operator import itemgetter 
from subprocess import call 
import math 
import itertools 
import operator 

call(["date"]) 

firstArray = [] 

firstString = "ABCD" 

firstList = list(firstString) 

for L in range(0, len(firstList)+1): 
    for subset in itertools.combinations(firstList, L): 

      firstArray.append(''.join(subset)) 

firstArray.reverse() 

print (firstArray) 

call(["date"]) 

但这种代码是不可扩展的。

如果我提供: -

firstString = "ABCDABCDABCDABCDABCDABCDABCD" 

程序需要近6分钟的时间内完成。

----------------捕获,同时运行该脚本--------------------

python sample-0012.py 
Wed Feb 8 21:30:30 PST 2017 
Wed Feb 8 21:30:30 PST 2017 

有人可以帮忙吗?

+0

我认为你必须现实。该字符串的长度为28个字符,它提供了一个长度为268435456的powerset(如果不包含空集,那么可以少一个)。它永远不会在眨眼之间发生。调用反向无疑无助,因为它排除了使用懒惰的迭代器。也许如果你真的想要最低优先,也许你可以使用'组合(data,len(firstList) - r)'来首先检索更大的组合。 –

回答

0

你在找什么叫做“Power set”(或Powerset)。 维基百科DEF:

任何集合S的功率设定(或幂)是集合S, 的所有子集包括空集和S本身的。

一个很好的解决方案可能是递归的,在这里你可以找到一个: link

0

为了更好地与幂的概念做经历, How to get all possible combinations of a list’s elements?

otherwise, you can do like this. 
    wordlist = []  
    for i in range(len(firststring)): 
      ...:  comblist = combinations(list(firststring), i+1) 
      ...:  same_length_words = [] 
      ...:  for i, word in enumerate(comblist): 
      ...:   if word not in same_length_words: 
      ...:    same_length_words.append(word) 
      ...:  for each_word in same_length_words: 
      ...:   wordlist.append(''.join(each_word)) 
      ...: 
0

试试这个

from itertools import chain, combinations 
firstString = 'ABCD' 
data = list(firstString) 
lists = chain.from_iterable(combinations(data, r) for r in range(len(data)+1)) 
print [''.join(i) for i in lists if i] 

# ['A', 'B', 'C', 'D', 'AB', 'AC', 'AD', 'BC', 'BD', 'CD', 'ABC', 'ABD', 'ACD', 'BCD', 'ABCD']