我想使用python熊猫来阅读json文件。该文件的每一行都是JSON中的完整对象。如何阅读使用Python熊猫的json文件?
我用下面版本 -
蟒蛇:2.7.6
大熊猫:1.19.1
JSON文件 -
{"id":"111","p_id":"55","name":"aaa","notes":"","childs":[]}
{"id":"222","p_id":"56","name":"bbb","notes":"","childs":[]}
{"id":"333","p_id":"75","name":"ccc","notes":"","childs":[]}
{"id":"444","p_id":"76","name":"ddd","notes":"","childs":["abc","efg","pqr"
,"rtu"]}
我使用下面的代码读取json文件 -
df = pd.read_json("temp.txt", lines = True)
print df
问题是,在json文件中,“childs”键包含一个未知索引数组,在“\ n”之间可用。所以如果我运行上面的代码,我得到ValueError:预期的对象或值但如果我删除“\ n”之后“pqr”可用我的代码得到工作。
我不想从我的数据中删除可用的“\ n”。我想在我的代码中处理这个问题。我想只使用python熊猫而不是python json库以良好的方式处理数据。
我如何才能利用python熊猫并处理这种类型的文件?
以字符串形式读取整个文件,并用新行分割,然后你有4个json字符串,你可以简单地解析。 –
@ErikŠťastný-好吧,但我怎么可以维持熊猫数据框中的数据后,吐出新的线? – kit
使json文件的每一行都成为一个有效的json,是一种更好的方法 – pktangyue