我正在尝试阅读python中的gunzipped文件(.gz),并且遇到了一些麻烦。从python中的gzip文件中读取utf-8字符
我用gzip的模块读取,但该文件编码为UTF-8文本文件,以便最终读取无效字符和崩溃。
有谁知道如何读取编码为utf-8文件的gzip文件?我知道有一个编解码器模块可以帮助,但我无法理解如何使用它。
谢谢!
import string
import gzip
import codecs
f = gzip.open('file.gz','r')
engines = {}
line = f.readline()
while line:
parsed = string.split(line, u'\u0001')
#do some things...
line = f.readline()
for en in engines:
print(en)
你可以发布你到目前为止的代码吗? – 2009-12-10 20:03:42
你能否将utf-8文件转换为ascii然后尝试解压缩?嗯.... – whatsisname 2009-12-10 20:06:06