0
我试图导入CSV到JSON在Python:Python的csv.DictReader嵌入非Unicode字符
myjson = list()
with open("stuff.csv","rU") as f:
vals = csv.DictReader(f)
for i in vals:
myjson.append(i)
当我使用CSV的DictReader(),我经常在看似无效的Unicode字符结束几乎每个记录,如:
\xc9
...在文本字段中。据我所知,这是一个有效的Unicode字符颠倒e。但是,由于它嵌入在较长的字符串中,所以它看起来实际上是未编码的,整个键是str类型而不是类型unicode。
我认为这是我给出的数据条目或csv模块的遗迹,但是有没有任何标志,标签或其他读取CSV的方式来处理这种转换?
然后,我仍然很难理解此文档。这是否意味着我的字符串是unicode,还是不是unicode?另外,为什么当我试图对这个期望有效的unicode的数据做任何事情时,它会失败?我的理解是python默认是unicode native,对吧? – Mittenchops
@Mittenchops:这些字符串是否带有'u'''或没有前缀? –
@Mittenchops:Python在很大程度上是unicode知道的,但是如果混合使用unicode和字节字符串值,事情会变得很难看(自动强制几乎不是一个好主意)。您需要针对您的具体问题创建一个新问题,以便我能够提供帮助。 –