我想通过Python代码读取中文文件。但是我得到了一个混乱的输出。python unicode-当我想读取文件中的内容
以下是我的代码:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
with open('1.doc', 'r+') as f:
text = f.readlines()
print text
输出:
\x01\x00\x00\xfe\xff\xff\xffy\x01\x00\x00z\x01\x00\x00{\x01\x00\x00|\x01\x00\x00}\x01\x00\x00~\x01\x00\x00\x7f\x01\x00\x00\x80\x01\x00\x00\x81\x01\x00\x00\x82\x01\
我知道,它必须在有一些编码或解码的问题。但我不知道如何弄清楚。
你期望得到什么? –
@一二三该文件的内容是中文。我想让它显示中文。 –
如果你打开一个MS Word文档,你将不得不手动将其转换,或者如果你在Windows上使用COM接口,如http://stackoverflow.com/a/32049165/69893那里。 –