2012-01-12 58 views
1

当我试图找到这个词的次数在UTF-8字符串,我得到了下一个:UnicodeEncodeError Python的

UnicodeEncodeError 
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-4: ordinal not in range(128) 

这就是我做

tr.words_count = (str(tr.transcribe).count(' ')) 

我需要计算在UTF多少字-8文本,似乎我的方法将无法正常工作。你有什么想法? 感谢

回答

4
str(tr.transcribe.decode('utf-8')) 

或者更好的是,

unicode(tr.transcribe).count(' ') 

甚至更​​好(以是否有连续多个空格不混淆),

len(unicode(tr.transcribe).split())