如何增加熊猫多指标特定级别的所有值?如何增加Pandas MultiIndex中的水平?
3
A
回答
2
您可以创建新MultiIndex.from_tuples
和分配:
df = pd.DataFrame({'A':[1,2,3],
'B':[4,5,6],
'C':[7,8,9],
'D':[1,3,5],
'E':[5,3,6],
'F':[7,4,3]})
df = df.set_index(['A','B'])
print (df)
C D E F
A B
1 4 7 1 5 7
2 5 8 3 3 4
3 6 9 5 6 3
#change multiindex
new_index = list(zip(df.index.get_level_values('A'), df.index.get_level_values('B') + 1))
df.index = pd.MultiIndex.from_tuples(new_index, names = df.index.names)
print (df)
C D E F
A B
1 5 7 1 5 7
2 6 8 3 3 4
3 7 9 5 6 3
与reset_index
和set_index
另一种可能的解决方案:
df = df.reset_index()
df.B = df.B + 1
df = df.set_index(['A','B'])
print (df)
C D E F
A B
1 5 7 1 5 7
2 6 8 3 3 4
3 7 9 5 6 3
解决方案与DataFrame.assign
:
print (df.reset_index().assign(B=lambda x: x.B+1).set_index(['A','B']))
个时序:
In [26]: %timeit (reset_set(df1))
1 loop, best of 3: 144 ms per loop
In [27]: %timeit (assign_method(df3))
10 loops, best of 3: 161 ms per loop
In [28]: %timeit (jul(df2))
1 loop, best of 3: 543 ms per loop
In [29]: %timeit (tuples_method(df))
1 loop, best of 3: 581 ms per loop
代码时序:
np.random.seed(100)
N = 1000000
df = pd.DataFrame(np.random.randint(10, size=(N,5)), columns=list('ABCDE'))
print (df)
df = df.set_index(['A','B'])
print (df)
df1 = df.copy()
df2 = df.copy()
df3 = df.copy()
def reset_set(df):
df = df.reset_index()
df.B = df.B + 1
return df.set_index(['A','B'])
def assign_method(df):
df = df.reset_index().assign(B=lambda x: x.B+1).set_index(['A','B'])
return df
def tuples_method(df):
new_index = list(zip(df.index.get_level_values('A'), df.index.get_level_values('B') + 1))
df.index = pd.MultiIndex.from_tuples(new_index, names = df.index.names)
return df
def jul(df):
df.index = pd.MultiIndex.from_tuples([(x[0], x[1]+1) for x in df.index], names=df.index.names)
return df
谢谢Jeff
另一种解决方案:
df.index.set_levels(df.index.levels[1] + 1 , level=1, inplace=True)
print (df)
C D E F
A B
1 5 7 1 5 7
2 6 8 3 3 4
3 7 9 5 6 3
1
这里有一个稍微不同的方式:
df.index = pd.MultiIndex.from_tuples([(x[0], x[1]+1) for x in df.index], names=df.index.names)
1000 loops, best of 3: 840 µs per loop
对于比较:
new_index = list(zip(df.index.get_level_values('A'),
df.index.get_level_values('B') + 1))
df.index = pd.MultiIndex.from_tuples(new_index, names = df.index.names)
1000 loops, best of 3: 984 µs per loop
的reset_index方法是慢10倍。
1
它可以是一样简单
df.index.set_levels(df.index.levels[0] + 1, 0, inplace=True)
演示
df = pd.DataFrame(
dict(A=[2, 3, 4, 5]),
pd.MultiIndex.from_product([[1, 2], [3, 4]])
)
df
df.index.set_levels(df.index.levels[0] + 1, 0, inplace=True)
df
+0
'TypeError:'FrozenList'不支持可变操作。'# –
+0
@JulienMarrec thx。定影 – piRSquared
相关问题
- 1. 如何增加MpChart中的水平图表值文本大小
- 2. reindex multiindex pandas数据框
- 3. Python Pandas datetime和multiindex问题
- 4. Pandas Multiindex Groupby on专栏
- 5. 基于MultiIndex Pandas填充NaN
- 6. 如何在pandas中的groupby之后访问MultiIndex列?
- 7. 如何水平增加此div的背景
- 8. 如何水平添加TextView?
- 9. 如何在嵌套字典中通过元素访问pandas multiindex?
- 10. 如何从pandas multiindex中获取随机(bootstrap)示例
- 11. 将元组的pandas列转换为MultiIndex
- 12. 如何增加Gwt水平面板表格高度
- 13. 如何随着页面宽度增加水平自动滚动
- 14. 熊猫,计算每个MultiIndex子水平的总和
- 15. 如何在t中添加水平ScrollBar:selectOneListbox?
- 16. 如何在Javascript中添加水平线
- 17. 如何重新索引Pandas Dataframe的列索引MultiIndex?
- 18. 我如何增加在DataGrid中的行空间(水平空间)柔性
- 19. 如何添加一行到熊猫DataFrame而不展平MultiIndex
- 20. 在ggplot2中增加数字图例的水平
- 21. 如何迭代pandas multiindex数据框使用索引
- 22. 如何在的JFreeChart的TimeSeries的Y值增加一个简单的水平线
- 23. 水平居中水平ItemsControl
- 24. 如何在android中创建增量水平滚动条?
- 25. 如果可用空间增加水平边距
- 26. 如何居中水平
- 27. 如何水平居中JSpinner
- 28. 如何缩小高度并增加自定义Chartjs水平线的线宽?
- 29. 如何减少/增加水平图例之间的差距 - 高图
- 30. 如何在Android平台中添加水平BarGraph?
很酷,谢谢!我觉得这很奇怪,这是一个繁琐的操作..:/ – ajwood
不幸的是。 – jezrael
我想有这样的性能实现细节? – ajwood