在Pandas中,我曾经能够获取数据框列,将其与第二个数据框列进行比较,并从第二列中获取缺失的所有项目:检索列中不存在于另一列中的所有值
notYetIncluded = notYetIncluded.loc[~notYetIncluded["ID"].isin(df_o["ID"])]
然而,不再更新的大熊猫(我的错误ValueError: Buffer dtype mismatch, expected 'Python object' but got 'long long'
)的作品。我怎么做?
,似乎引起破损的部分是这样的:notYetIncluded["ID"].isin(df_o["ID"])
我不知道是否有帮助,但这些列存储目前只是数字像4150
,5808
等,它们都是4个位数或不太长。
例如:
notYetIncluded: 0 5747 1 5746 2 5725 3 5722 4 5720 5 5707 Name: ID, dtype: object
df_o: 24 5365 4 5720 15 5599 Name: ID, dtype: int64
什么是这些列的数据类型? – MattR
这一个特别是一个数字 – Elliptica
他们都'数字'?尝试'print(dataframe.dtypes)'让我们知道这些列的数据类型是什么 – MattR