2016-02-12 55 views
2

我需要程序的帮助来识别句子中的单个单词,将它们存储在列表中,并将原始句子中的每个单词替换为该单词在名单。这是我到目前为止。列表中的单个词然后打印这些词的位置

例如:

'ASK NOT WHAT YOUR COUNTRY CAN DO FOR YOU ASK WHAT YOU CAN DO FOR YOUR' COUNTRY 

将重建为1,2,3,4,5,6,7,8,9,1,3,9,6,7,8,4,5

from collections import OrderedDict 

sentence = input("Please input a sentence without punctuation").upper() 

punctuation = ("`1234567890-=¬!£$%^&*()_+\|[];'#,./{}:@~<>?") 

FilteredSentence = ("") 

for char in sentence: 
    if char not in punctuation: 
     FilteredSentence = FilteredSentence+char 

FilteredSentence = FilteredSentence.split(" ") 

refined = list(OrderedDict.fromkeys(FilteredSentence)) 

我已成功地识别,但是我的工作如何替换原始列表与的个别单词的位置的话列表中的各个单词。

+0

你的意思是第一个外观指数字? – Obsidian

+0

我认为你需要清单上的'.index'方法。 'help([]。index)' –

回答

4

您还可以创建一个字典映射与他们的初始位置的话,那么用它来与各自的岗位上替代词。

>>> s = 'ASK NOT WHAT YOUR COUNTRY CAN DO FOR YOU ASK WHAT YOU CAN DO FOR YOUR COUNTRY' 
>>> 
>>> 
>>> l = s.split() 
>>> l 
['ASK', 'NOT', 'WHAT', 'YOUR', 'COUNTRY', 'CAN', 'DO', 'FOR', 'YOU', 'ASK', 'WHAT', 'YOU', 'CAN', 'DO', 'FOR', 'YOUR', 'COUNTRY'] 
>>> 
>>> d = dict((s, l.index(s)+1) for s in set(l)) 
>>> d 
{'DO': 7, 'COUNTRY': 5, 'CAN': 6, 'WHAT': 3, 'ASK': 1, 'YOUR': 4, 'NOT': 2, 'FOR': 8, 'YOU': 9} 
>>> list(map(lambda s: d[s], l)) 
[1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 3, 9, 6, 7, 8, 4, 5] 
>>> 
+0

嗯....好简洁 – danidee

+0

感谢您的解答!它适用于我的目的。 – Faker

+0

@Faker .. no pblm .. :) –

10

是否这样?只要做一个列表理解来获得所有单词的所有索引。

In [77]: sentence = "ASK NOT WHAT YOUR COUNTRY CAN DO FOR YOU ASK WHAT YOU CAN DO FOR YOUR COUNTRY" 

In [78]: words = sentence.split() 

In [79]: [words.index(s)+1 for s in words] 
Out[79]: [1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 3, 9, 6, 7, 8, 4, 5] 
0

这样做的天真的方式。

mystr = "ASK NOT WHAT YOUR COUNTRY CAN DO FOR YOU ASK WHAT YOU CAN DO FOR YOUR COUNTRY" 
a = mystr.split(" ") 
k = dict() 
cnt = 1 
b = [] 
for m in a: 
    if m not in k: 
     k[m] = str(cnt) 
     cnt = cnt + 1 
    b.append(k[m]) 
print ",".join(b) 

较短的版本。

mystr = "ASK NOT WHAT YOUR COUNTRY CAN DO FOR YOU ASK WHAT YOU CAN DO FOR YOUR COUNTRY" 
a = mystr.split(" ") 
print ",".join([str(a.index(k)+1) for k in a]) 
+0

请注意,我在使用'str()'进行类型转换,这样我就可以将它们加入到您要求的格式中。 – GokulSrinivas

0

而不是OrderedDict你可以使用一个集合。

refined = list(set(FilteredSentence)) 

比你可以检查列表中的每个单词。

index_list = [] 
for word in FilteredSentence: 
    index_list.append(refined.index(word) +1) 

起始-TC是你自找的

0

现有的答案只是一个细化的结果 - 您可以使用字典解析来创建查找从词索引:

>>> lookup = {w:(i+1) for i, w in list(enumerate(refined)) } 

>>> lookup 
{'DO': 7, 'WHAT': 3, 'FOR': 8, 'COUNTRY': 5, 'NOT': 2, 'CAN': 6, 
'ASK': 1, 'YOU': 9, 'YOUR': 4} 

然后使用列表理解生成输出索引:

>>> [lookup[w] for w in FilteredSentence] 
[1, 2, 3, 4, 5, 6, 7, 8, 9, 1, 3, 9, 6, 7, 8, 4, 5] 
相关问题