我正在查看Fastest way to iterate through a pandas dataframe?,我不确定它是否可以应用于我的情况。我想使样品和功能的字典中数据帧从Pandas DataFrame存储数据的最快方法
#DF_gex is a DataFrame
D_sample_Data = {}
class Sample:
def __init__(self,D_key_value):
self.D_key_value = D_key_value
for i in range(DF_gex.shape[0]):
D_key_value = {}
sample = DF_gex.index[i]
for j in range(DF_gex.shape[1]):
key = DF_gex.columns[j]
value = DF_gex.iloc[i,j]
D_key_value[key] = value
D_sample_Data[sample].D_key_value = D_key_value
我基本上有一个名为样品在这种情况下类,在样本I类存储字典为每个实例(D_key_value)。现在我遍历每一行和每一列。
有没有更快的方法来做到这一点?我知道熊猫是基于Numpy数组,它具有用于索引的特殊功能。这些方法中的一种可以用于这个吗?
最后,我将有一个字典对象D_sample_Data,其中我输入一个样本名称并获取一个类实例。在那个类实例中,将会有一个该样本键唯一的字典对象。
你可以更新什么样的你正在寻找的输出? –
@AnandSKumar我添加了输出的类型。它基本上是一个字典,其中D_sample_Data导致类实例,并且该实例具有一些字典和其他对象。这是我能想到的最简单的例子 –