分类D型我有两个dataframes具有相同的列名和dtypes,类似于以下:保留在数据帧级联
A object
B category
C category
的分类并不是在每个dataframes相同。
当正常concatinating,熊猫输出:
A object
B object
C object
这是预期行为每the documentation。
但是,我希望保留分类并希望将类别合并,所以我尝试了跨数据框中两个分类的列上的union_categorical。 cdf
和df
是我的两个数据框。
for column in df:
if df[column].dtype.name == "category" and cdf[column].dtype.name == "category":
print (column)
union_categoricals([cdf[column], df[column]], ignore_order=True)
cdf = pd.concat([cdf,df])
这仍然没有提供给我一个分类输出。
您使用的是什么版本的熊猫?我无法复制这种行为。 – C8H10N4O2
0.20.1 - union_categoricals在版本0.19.0中是新增的。 – tom
我得到一个'ValueError:类别concat中的不兼容类别,但我仍然在0.18.1 – C8H10N4O2