为什么一列停留在数据帧的指数即使它被丢弃

考虑下面的代码：为什么一列停留在数据帧的指数即使它被丢弃

>>> data = pandas.DataFrame({ 'user': [1, 5, 3, 10], 'week': [1, 1, 3, 4], 'value1': [5, 4, 3, 2], 'value2': [1, 1, 1, 2] }) 
>>> data = data.pivot_table(index='user', columns='week', fill_value=0) 
>>> data['target'] = [True, True, False, True] 
>>> data 
    value1  value2  target 
week  1 3 4  1 3 4 
user 
1   5 0 0  1 0 0 True 
3   0 3 0  0 1 0 True 
5   4 0 0  1 0 0 False 
10  0 0 2  0 0 2 True

现在，如果我把这叫做：

>>> 'target' in data.columns 
True

它返回True预期。但是，为什么这也会返回True？

>>> 'target' in data.drop('target', axis=1).columns 
True

我怎样才能从表删除列所以它不再索引和上面的语句返回False？

来源

2017-04-04 chuckeles

从现在开始（pandas 0.19.2），multiindex将保留其结构中所有使用过的标签。删除列不会从多重索引中删除它的标签，并且它仍然在其中引用。参见长GH项目here。

因此，您必须解决问题并进行假设。如果你确信你正在检查的标签是在一个特定的指数水平（在你的例子0级），再一个办法是做这样的：

'target' in data.drop('target', axis=1).columns.get_level_values(0) 
Out[145]: False

如果它可以是任何级别，就可以使用get_values()和查找整个列表：

import itertools as it 
list(it.chain.from_iterable(data.drop('target', axis=1).columns.get_values())) 
Out[150]: ['value1', 1, 'value1', 3, 'value1', 4, 'value2', 1, 'value2', 3, 'value2', 4]

来源

2017-04-04 20:20:56 Boud

注意在0.20.0（约1个月），这将是在合并：https://github.com/pandas-dev/pandas/pull/15694，这将允许''data.columns = data.columns.remove_unused_levels（）''来解决这个问题（它不是自动的，但可以缓解的东西） – Jeff

为什么一列停留在数据帧的指数即使它被丢弃

回答

相关问题