我尝试在Python拆分这种线:如何在Python中分割多语言行并获取Unicode十六进制值?
aiburenshi 爱不忍释 "לא מסוגל להינתק, לא יכול להיפרד מדבר מרוב חיבתו אליו"
此行包含希伯来文,简体中国和英语。
如果我有例如一个元组T,我想获得的元组是T =(希伯来文字符串,英文字符串,中国字符串)。
的问题是,我不知道如何让希伯来字母的中国的Unicode值。这两行不工作:
print ((unicode("释","utf-8")).encode("utf-8"))
print ((unicode("א","utf-8")).encode("utf-8"))
而且我得到这个错误:
SyntaxError: Non-ASCII character '\xe9' in file split_or.py on line 9, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details
这可能是值得说明您正在使用(x或3 x)的Python的版本无论是在问题中,标签或两者兼而有之。 – 2012-01-06 09:44:01
你有没有在你的文件的开头声明任何编码,如#coding:UTF-8? – 2012-01-06 10:46:26
你的国家的问题是一个非常明确的埃罗,即使包含的链接,告诉你如何解决这个问题的文本。你为什么不读链接?因此,这是[在Python源代码中使用utf-8编码]的副本(http://stackoverflow.com/questions/6289474/working-with-utf-8-encoding-in-python-source) – 2013-05-04 16:25:52