2016-02-28 52 views
2

版本:的Python 3.4.3在Python值的所有可能的组合

嗨,我想创建一个脚本读取一些选择项目的菱选择在一个HTML文件,并创建一个数据库所有可能的选择都基于它们的值为其分配唯一的ID。

这是HTML的结构:

   <select id="perforar" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)"> 
       <option value="g1">sin perforacion</option> 
       <option value="g2">1 Linea de perforación</option> 
       <option value="g3">2 Lineas de perforación</option> 
       <option value="g4">3 Lineas de perforación</option> 
       <option value="g5">4 Lineas de perforación</option> 
       <option value="g6">5 Lineas de perforación</option> 
       <option value="g7">6 Lineas de perforación</option> 
      </select></td> 
      </tr><tr><td>Ennoblecimiento: </td><td> 
      <select id="ennoblecimiento" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)"> 
       <option value="h1">sin ennoblecimiento</option> 
       <option value="h2">barniz UV</option> 
       <option value="h3">laminado</option> 
      </select></td> 
      </tr><tr><td>Plegado: </td><td> 
      <select id="plegado" onchange="Actualiza(this.id, this.options[this.selectedIndex].value)"> 
       <option value="i1">plegado envolvente</option> 
       <option value="i2">plegado en acordéon</option> 
       <option value="i3">plegado en ventana</option> 

我手动复制/粘贴所有入.txt,然后运行该代码:

#load file into buffer 
leyendo = open("generadorbasedatos.txt", 'r') 
archivotxt = leyendo.read() 
leyendo.close() 
#split it for lines 
listadividida = [] 
listadividida= archivotxt.split("\n") 
#create a dict for later 
basededatos = {} 

#for each line 
for i in listadividida: 
    if not "<option" in i: #if isn't an option, delete that line 
     i = "" 
    else: #if it's an option, get the value and the text 
     #the text 
     desde = '>' 
     hasta = '<' 
     _,_,resto = i.partition(desde) 
     opcion,_,_ = resto.partition(hasta) 
     #the value 
     desde = 'value="' 
     hasta = '">' 
     _,_,resto = i.partition(desde) 
     laid,_,_ = resto.partition(hasta) 
     #add them to a dict 
     basededatos[laid] = [opcion, laid] 
     #And this is where I'm lost and I need help 
print(basededatos) 

现在到了麻烦,我想该脚本创建所有可能组合的列表并为每个组合分配一个ID,以使用这些值创建ID,因此输出应如下所示:

g1h1i1: [1 Linea de perforación, Sin ennoblecimiento, plegado envolvente] 
g1h1i2: [1 Linea de perforación, Sin ennoblecimiento, plegado en acordeón] 
g1h1i3: [1 Linea de perforación, Sin ennoblecimiento, plegado en ventana] 
g1h2i1: [1 Linea de perforación, barniz, plegado envolvente] 
g1h2i2: [1 Linea de perforación, barniz, plegado plegado en acordeón] 
g1h3i3: [1 Linea de perforación, barniz, plegado en ventana] 

最终所有可能的组合。我尝试itertools,并设法冻结我的电脑(可能是由于内存不足或无限循环问题),所以现在我在这里问。

什么是实现我想要做的最好的方法?

注意:有超过12个选择,这里只复制/粘贴3个例子,但代码应该能够创建超过3个选择的所有组合。

+0

你需要的'[1凌特德perforación,仙ennoblecimiento,plegado envolvente]'部分或它足以创建包含哪些选项列表的“唯一ID”。 – pzp

+0

如果有超过12个选择,你会得到大量的组合 - 假设平均每个选择5项意味着超过2.4亿个组合('5 ** 12')。这可能是为什么它需要一段时间... –

+0

@pzp理想情况下,我想知道什么选项实际上创建该唯一的ID。 – Saelyth

回答

0

从您的角度来看,这实现你的目标:

from itertools import product 
base={'g':[],'h':[],'i':[]} 
for (key,value) in basededatos.items(): base[key[0]].append(value) # to split the fields. 
products=product(*base.values()) #make all combinations 
finaldict={ "".join([p[1] for p in t]) : [p[0] for p in t] for t in products } 
# formatting in a dictionnary. 

某些值:

In [263]: base 
Out[263]: 
{'g': [['1 Linea de perforación', 'g2'], 
    ['4 Lineas de perforación', 'g5'], 
    ['2 Lineas de perforación', 'g3'], 
    ...., 
'h': [['laminado', 'h3'], ['barniz UV', 'h2'], ['sin ennoblecimiento', 'h1']], 
'i': [['plegado en ventana', 'i3'], 
    ['plegado en acordéon', 'i2'], 
    ....]} 


In [265]: finaldict 
Out[265]: 
{'g1h3i2': ['sin perforacion', 'laminado', 'plegado en acordéon'], 
'g7h2i1': ['6 Lineas de perforación', 'barniz UV', 'plegado envolvente'], 
'g2h3i3': ['1 Linea de perforación', 'laminado', 'plegado en ventana'],.... 
+0

当我添加11个基础值而不是3个(a,b,c,d,e,f,g, H,I,J,K)。可能是因为组合太多了? – Saelyth

+0

可能。有(a的选择数量)*(b的选择数量)* ... *(k个选项的数量)组合。多少 ? –