2016-03-03 121 views
0

我有一个对象表示为嵌套字典\数组 该集合中的所有对象都具有相同的架构,尽管数组中的条目数量可能因对象而异有所不同 我正在寻找一种存储此数据的好方法,这将允许简单的批量操作。 特别是,快速访问列\列作为numpy数组很重要(这是不使用一个简单的对象列表的主要原因)什么是表示分层对象向量的好方法?

熊猫与MultiIndex是我的第一个想法,但我不相信它可以支持可变长度阵列

+0

你能提供一个数据的例子吗? – Colin

+0

例如: {'name':'john','cars':[{'make':'mazda','licence_plate':123},{'make':'ford','licence_plate':456} ]} –

+0

然后你会得到这些字典的列表?只是一个DataFrame pd.DataFrame([''john','mazda',123),('john','ford',456)],columns = ['name','make','license_plate “])'? – Colin

回答

2

pytables是这个用例的一个非常可靠的选项。它支持可变长度数组。

+0

你确定阵列支持一个字段吗?我找不到这方面的参考 –

相关问题