我想read_csv
csv文件与西里尔字体与pandas。python熊猫read_cvs加载utf-8
import pandas
data = pandas.read_csv('dataset.csv', delimiter='\|\|', engine='python', encoding='utf-8')
print type(data.name[0])
<type 'str'>
在这里,我期待得到unicode
与
print type(u'hello')
<type 'unicode'>
我做错了吗?
Python是鸭类型。你永远不应该问什么类型的对象。这就是说,你需要提供一些例子,你可以展示你的产品和你想要的产品。你的代码显示正确AFAIK – firelynx
我不知道熊猫如何实现'read_csv'方法,但是如果它使用std.lib。 'csv'模块,那么解决这个问题的方法可能不是微不足道的,因为Python 2的'csv'不支持解码文件(实际上这很令人伤心)。现在再切换到Python 3的另一个原因! – lenz