我有一个超过10万行的dF和几列宽 - 没有什么疯狂的。我试图根据大约4000个字符串的列表对行进行子集划分,但我正在努力弄清楚如何这样做。有没有一种方法来使用类似的子集。如何基于字符串值列表对熊猫数据框进行分类?
东风看起来像这样
dog_name count
===================
Jenny 2
Fido 4
Joey 7
Yeller 2
和字符串列表中包含的变量dog_name_list=['Fido', 'Yeller']
我试着沿 df[df['dog_name'].isin(dog_name_list)
线的东西,但我得到一个有趣的错误: unhashable type: 'list'
我检查了similar question,docs和this的子集数据通过查看列表中是否存在某个值,但是这让我无所适从,而且我对我所缺少的东西有些困惑。非常感谢别人的建议!
检查'dog_name'列中是否有任何列表:'any((在df.dog_name中v的isinstance(v,list)))' – Alexander
您的命令是正确的,可能是Alexander指出的一个数据问题。 –