这似乎相当明显,但我似乎无法弄清楚如何将数据帧的索引转换为列?如何将数据框中的熊猫索引转换为列?
例如:
df=
gi ptt_loc
0 384444683 593
1 384444684 594
2 384444686 596
要,
df=
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
这似乎相当明显,但我似乎无法弄清楚如何将数据帧的索引转换为列?如何将数据框中的熊猫索引转换为列?
例如:
df=
gi ptt_loc
0 384444683 593
1 384444684 594
2 384444686 596
要,
df=
index1 gi ptt_loc
0 0 384444683 593
1 1 384444684 594
2 2 384444686 596
或者:
df['index1'] = df.index
,或者.reset_index
:
df.reset_index(level=0, inplace=True)
所以,如果你有3级指标,如多指标框架:
>>> df
val
tick tag obs
2016-02-26 C 2 0.0139
2016-02-27 A 2 0.5577
2016-02-28 C 6 0.0303
,并要在索引中的第一个(tick
)和第三(obs
)水平转换成列,你会怎么做:
>>> df.reset_index(level=['tick', 'obs'])
tick obs val
tag
C 2016-02-26 2 0.0139
A 2016-02-27 2 0.5577
C 2016-02-28 6 0.0303
对于多指标,你可以使用提取其分类指数
df['si_name'] = R.index.get_level_values('si_name')
其中si_name
是子索引的名称。
为了更清楚一点,我们来看一下在其索引中有两个级别的DataFrame(一个MultiIndex)。
index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'],
['North', 'South']],
names=['State', 'Direction'])
df = pd.DataFrame(index=index,
data=np.random.randint(0, 10, (6,4)),
columns=list('abcd'))
的reset_index
方法,调用默认参数,将所有指数水平列,并使用一个简单的RangeIndex
的新指标。
df.reset_index()
使用level
参数来控制哪些索引电平被转换成列。如有可能,请使用更清晰的级别名称。如果没有关卡名称,则可以通过其整数位置来引用每个关卡,这些位置从外部开始为0。您可以在这里使用标量值或者您想要重置的所有索引的列表。
df.reset_index(level='State') # same as df.reset_index(level=0)
在极少数情况下,你要保留指数,并打开索引的列,您可以执行以下操作:
# for a single level
df.assign(State=df.index.get_level_values('State'))
# for all levels
df.assign(**df.index.to_frame())
记住,你必须对你所有的索引做n次(例如,如果你有两个索引,那么你必须做两次) – dval
用'df.reset_index(level = df.index.names,inplace = True)'可以将给定的整个多索引到列 – venti
你可以在列上有一个索引只是添加到数据框,所以它是一个真正的列和索引? – bretcj7