熊猫设置多行数据帧

我使用read_csv并希望删除一些具有特定值的行，我可以在单独的行中做到这一点，但是当我想在同一行中调用它们时，它将返回一个NoneType错误。熊猫设置多行数据帧

我的第一个代码：

census_df = pd.read_csv('census.csv') 
census_df.drop(census_df['SUMLEV'] == 40, inplace=True)

我想做的事：

census_df = (pd.read_csv('census.csv') 
       .drop(census_df['SUMLEV'] == 40, inplace=True))

它返回一个错误：

TypeError: 'NoneType' object is not subscriptable

来源

2016-11-08 paulmassimo

我想你需要通过index从boolean indexing下降：

census_df = (pd.read_csv('census.csv').drop(census_df[(census_df['SUMLEV'] == 40)].index))

但更好的是使用boolean indexing：

census_df = pd.read_csv('census.csv') 
census_df = census_df[census_df['SUMLEV'] != 40]

来源

2016-11-08 06:00:42 jezrael

是的，我知道布尔方式，我只是想在输入干净代码的数据框时应用它。顺便说一句，布尔索引比.drop更好吗？ – paulmassimo

我测试它，并与滴更慢2倍。 'c'：['SUMLEV'：[40,2,3]， 'B'：[4,5,6]， 'C'：[7,8,9]， 'D' ：[1,3,5]， 'E'：[5,3,6]， 'F'：[7,4,3]}） print（census_df）'然后'％timeit（census_df [（census_df ['SUMLEV']！= 40）]） 1000循环，最好为3：每循环388微秒和'％timeit（census_df.drop（census_df [（census_df ['SUMLEV'] == 40）] .index）） 1000循环，最好3：每循环723微秒' – jezrael

非常感谢 – paulmassimo

的原因是下降返回None如果是指示在现场执行（按照就地操作员的建议）。移除操作员（这会产生一些内存和处理成本）或者分两行操作。

来源

2016-11-08 05:52:49

删除就地后，它跑了，但答错，仅下降了第一行值为40. – paulmassimo

通常应该工作，我不知道你的代码有什么不同，抱歉。我会建议用更多信息打开一个新问题 –

我必须删除所有具有值的行的索引。谢谢。 – paulmassimo

熊猫设置多行数据帧

回答

相关问题