2016-08-25 113 views
1

我有一系列在特拉维斯CI上运行的单元测试,在PY3.2上只有只有,它会肚子痛。我怎样才能解决这个问题,而不使用six.u()?在Python 3.2上缺少U字符串?

def test_parse_utf8(self): 
    s = String("foo", 12, encoding="utf8") 
    self.assertEqual(s.parse(b"hello joh\xd4\x83n"), u"hello joh\u0503n") 

====================================================================== 
ERROR: Failure: SyntaxError (invalid syntax (test_strings.py, line 37)) 
---------------------------------------------------------------------- 
Traceback (most recent call last): 
    File "/home/travis/virtualenv/python3.2.5/lib/python3.2/site-packages/nose/failure.py", line 39, in runTest 
    raise self.exc_val.with_traceback(self.tb) 
    File "/home/travis/virtualenv/python3.2.5/lib/python3.2/site-packages/nose/loader.py", line 414, in loadTestsFromName 
    addr.filename, addr.module) 
    File "/home/travis/virtualenv/python3.2.5/lib/python3.2/site-packages/nose/importer.py", line 47, in importFromPath 
    return self.importFromDir(dir_path, fqname) 
    File "/home/travis/virtualenv/python3.2.5/lib/python3.2/site-packages/nose/importer.py", line 94, in importFromDir 
    mod = load_module(part_fqname, fh, filename, desc) 
    File "/home/travis/build/construct/construct/tests/test_strings.py", line 37 
    self.assertEqual(s.build(u"hello joh\u0503n"), b"hello joh\xd4\x83n") 
              ^
SyntaxError: invalid syntax 

试图得到这个工作:

PY3 = sys.version_info[0] == 3 
def u(s): return s if PY3 else s.decode("utf-8") 

self.assertEqual(s.parse(b"hello joh\xd4\x83n"), u("hello joh\u0503n")) 

报价从https://pythonhosted.org/six/

在Python 2中,U()不知道是什么编码的字面意思是。 每个字节直接转换为同一个 值的unicode码点。因此,使用u()与ASCII数据的字符串 只是安全的。

但是,使用unicode的重点不仅限于ASCII。

+2

是的,3.2只是没有这种语法。你是否需要使用相同的代码库来支持Python 2和Python 3.2,而不使用'2to3'? – user2357112

+0

@ArekBulski:2to3永远不应该让你使用'six'。我不认为2to3中的任何代码都知道“six”。当我使用'u'文字对代码运行2to3时,它会剥掉'u'。 – user2357112

回答

1

我觉得你在这里运气不好。

要么使用six.u()要么删除对Python 3.2的支持。

+0

来源位于:https://github.com/spotify/luigi/blob/b5b578da87f8ed18bb2b8c077f2d24cc5d912c7c/luigi/six.py#L646-L647 本质上,它让Python 3的字符串通过并转换为Python 2上的unicode。 –

1

您可以改为from __future__ import unicode_literals而不是在任何地方使用u语法?

from __future__ import unicode_literals在早期版本的Python中生成没有前面的字符串文字u的行为与Python 3中的相同,默认为unicode。因此,如果您执行from __future__ import unicode_literals并将所有u"strings"更改为"strings",那么您的字符串文字将在所有版本中为unicode。这不会影响b文字。

+0

此解决方案在Travis上失败。 – ArekBulski

0

我执行了six.u()并丢弃six

import sys 
PY3 = sys.version_info[0] == 3 
def u(s): return s if PY3 else unicode(s.replace(r'\\', r'\\\\'), "unicode_escape")