2015-02-11 160 views
0

下面的示例是剥离标点和文字转换成从ranbo.txt文件小写...分割字符串用空格,然后做一个计数

帮我用空格来分割这

infile = open('ranbo.txt', 'r') 
lowercased = infile.read().lower() 
for c in string.punctuation: 
    lowercased = lowercased.replace(c,"") 
white_space_words = lowercased.split(?????????) 
print white_space_words 

现在经过这个拆分 - 我怎么能找到这个列表中有多少单词?

count or len function? 
+0

'len个(white_space_words)'?当然'lowercased.split(?????????)'会抛出一个异常,无论如何,所以试图找到返回列表的大小将有点没有意义... – twalberg 2015-02-11 14:43:55

回答

1
white_space_words = lowercased.split() 

分割使用的空白字符的任何长度。

'a b \t cd\n ef'.split() 

回报

['a', 'b', 'cd', 'ef'] 

但你可以做到这一点还等全面:

import re 
words = re.findall(r'\w+', text) 

返回从text所有 “字” 的列表。

开始使用len()其长度:

len(words) 

,如果你想将它们合成为一个新的字符串用换行:

text = '\n'.join(words) 

作为一个整体:

with open('ranbo.txt', 'r') as f: 
    lowercased = f.read().lower() 
words = re.findall(r'\w+', lowercased) 
number_of_words = len(words) 
text = '\n'.join(words) 
+0

怎么做我添加空白字符(空格,制表符或换行符),然后我怎样才能得到计数? – 2015-02-11 14:30:57

+0

你想在哪里添加空格? – eumiro 2015-02-11 14:35:38

+0

之间的单词....换行b换行c换行... – 2015-02-11 14:38:32

相关问题