在下面的代码中,Python似乎没有使用阿拉伯字母。有任何想法吗?在Python中打印阿拉伯语/波斯语字母2.7
#!/usr/bin/python
# -*- coding: utf-8 -*-
import nltk
sentence = "ورود ممنوع"
tokens = nltk.word_tokenize(sentence)
print tokens
结果是:
>>>
['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf', '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']
>>>
我也试过字符串前增加一个u
,但它并没有帮助:
>>> u"ورود ممنوع">>>
['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf', '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']
你试过'U “ورودممنوع”'? – RedX
阅读最后一行。 – Omid
添加'u“ورودممنوع”'时的输出是什么? –