2
也许有人可以帮助我。我试图平以下IST为大熊猫数据帧:从嵌套json列表中拼合熊猫DataFrame
[{u'_id': u'2',
u'_index': u'list',
u'_score': 1.4142135,
u'_source': {u'name': u'name3'},
u'_type': u'doc'},
{u'_id': u'5',
u'_index': u'list',
u'_score': 1.4142135,
u'_source': {u'dat': u'2016-12-12', u'name': u'name2'},
u'_type': u'doc'},
{u'_id': u'1',
u'_index': u'list',
u'_score': 1.4142135,
u'_source': {u'name': u'name1'},
u'_type': u'doc'}]
结果应该是这样的:
|_id | _index | _score | name | dat | _type |
------------------------------------------------------
|1 |list |1.4142..| name1| nan | doc |
|2 |list |1.4142..| name3| nan | doc |
|3 |list |1.4142..| name1| 2016-12-12 | doc |
但所有我试图做的是不可能得到想要的结果。 我以前是这样的:
df = pd.concat(map(pd.DataFrame.from_dict, res['hits']['hits']), axis=1)['_source'].T
但后来我松散的类型至极是_source领域之外。 我也试图与
test = pd.DataFrame(list)
for index, row in test.iterrows():
test.loc[index,'d'] =
工作,但我不知道如何来使用领域_source并追加到原始数据帧的地步。
有人有一个想法如何去成为期望的结果?