给予相同的文字,我知道我可以用NLTK的资料Tweet标记生成令牌化它例如产生“伟大的饮料,牛肉薯饼,咖啡,玉米煎饼。”:符号化,分离由标点符号拆分令牌
['Great',
'drinks',
',',
'beef',
'hash',
',',
'coffee',
',',
'burritos',
'.']
我要分开处理逗号和句号前的每个部分,以生成一个列表,如[Great drinks, beef hash, coffee, burritos]
。我将如何做到这一点?
完美 - 谢谢 – user3058703