1
是否可以访问原始argv元素二进制内容?作为python3中的字节访问命令行参数
$ python3 -c'import sys;print(sys.argv);' `echo -ne "\xff\x80\x00\xff"`
['-c', '\udcff\udc80\udcff']
是否可以访问原始argv元素二进制内容?作为python3中的字节访问命令行参数
$ python3 -c'import sys;print(sys.argv);' `echo -ne "\xff\x80\x00\xff"`
['-c', '\udcff\udc80\udcff']
可以得到的argv含量的不同作为字节如下:
#!/usr/bin/python3
import sys
arg1_bytes = sys.argv[1].encode(sys.getfilesystemencoding(), 'surrogateescape')
来源:PEP 383 - Non-decodable Bytes in System Character Interfaces,经由answer on "Command-line arguments as bytes instead of strings in python3";另请参阅answer on "sys.argv as bytes in Python 3k"
请注意,这不是文件名编码问题,如http://stackoverflow.com/questions/3557830/command-line-arguments-as-bytes-instead-of-strings-in-python3或http://stackoverflow.com/questions/6981594/sys-argv-as-bytes-in-python-3k我没有任何文本编码问题。这不是关于文字。 – Nope 2014-10-22 09:01:55