我具有类似于这一个大熊猫帧:查找在大熊猫帧列中的数组元素的位置(又名pd.series)
import pandas as pd
import numpy as np
data = {'Col1' : [4,5,6,7], 'Col2' : [10,20,30,40], 'Col3' : [100,50,-30,-50], 'Col4' : ['AAA', 'BBB', 'AAA', 'CCC']}
df = pd.DataFrame(data=data, index = ['R1','R2','R3','R4'])
Col1 Col2 Col3 Col4
R1 4 10 100 AAA
R2 5 20 50 BBB
R3 6 30 -30 AAA
R4 7 40 -50 CCC
鉴于目标的数组:
target_array = np.array(['AAA', 'CCC', 'EEE'])
我想要找到Col4
中的单元格索引,这些索引也出现在target_array
中。
我试图找到一个记录的答案,但它似乎超出了我的技能......任何人有任何建议?
P.S.顺便说一下,对于这种特殊情况,我可以输入一个目标数组,其元素是数据帧索引名称array(['R1', 'R3', 'R5'])
。这样会更容易吗?
编辑1:
非常感谢所有伟大的回复。可悲的是我只能选择一个,但每个人似乎都认为@Divakar是最好的。不过你应该看看piRSquared和MaxU速度比较所有可用
这样更快! – piRSquared
@piRSquared嗯,我希望是,作为一个NumPy的东西! ;) – Divakar
我一定会记住这一点。 – piRSquared