2015-10-04 136 views
0

Python可以将Unicode实体转换为Unicode吗? ex) \u0639\u0631\u0628\u0649 to عربى将Unicode实体转换为Unicode文本

我想这是可以做到in this website

这将帮我解析JSON的unicode实体FYI产生有效的URL

ex) 'S\\u00f8ren Kierkegaard' -> https://en.wikipedia.org/wiki/Søren_Kierkegaard

,如果你使用维基百科的API完全一样的东西,您将遇到很多对象,如'\\u00f8'https://en.wikipedia.org/w/api.php?action=query&titles=Søren_Kierkegaard&prop=revisions&rvprop=content&format=json

+0

当我看到我一直在努力与这个“概念简单”的东西几个小时这样的unicode的问题,我真的很害怕,浑身发抖:) – marmeladze

+0

。我现在感到头晕。 – SUNDONG

+0

你的问题有点不清楚。你有什么类型的字符串?它是否必须使用'%uxxxx'模式?你知道如何用Python的风格来表示事物,你不能只是转换它吗? –

回答

4

Python支持编码调用ED unicode-escape,这将有助于在这里:​​

>>> br'\u0639\u0631\u0628\u0649'.decode('unicode-escape') 
'عربى' 
0
$ python 
Python 2.7.6 (default, Jun 22 2015, 17:58:13) 
[GCC 4.8.2] on linux2 
Type "help", "copyright", "credits" or "license" for more information. 
>>> a = u'\u0639\u0631\u0628\u0649' 
>>> print a 
عربى 
>>>