我试图从dfA
中删除dfB
中的项目。熊猫将列转换为整数不起作用
事情是dfA
是在对象类型,所以我想转换为int。 下面是代码:
dfA = pd.read_excel('small_file.xlsx',header=None)
dfB = pd.read_csv('large_file.csv',header=None)
dfA = dfA.convert_objects(convert_numeric=True)
dfA[0] = pd.to_numeric(dfA[0],errors='coerce')
dfA = dfA.dropna()
# converting to int
dfA[0] = dfA[0].astype(int) # THIS line gets error
df_output = dfA[~dfA[0].isin(dfB[0])]
这里是DFA看起来像
0
0 2293365227
1 3045897298
2 8162414592
3 9312969810
... ...
和DFB
0
0 2030000000
1 2030156119
2 2030389149
... ...
我得到这个错误:
ValueError: invalid literal for long() with base 10: 'Goulding'