我有d1和d2,我想通过ID列合并两个。 但是,ID和ID2不完全匹配。相反,ID是ID2的前8位(有时可以是前6位数字,有时也可以是一位或两位数字)。通过正则表达式或模糊匹配合并数据帧
据我所知,我可以预处理ID2只保留前8位数字。但是,我无法处理所有情况。
我不知道是否有一种先进的方式来融合正则表达式模糊匹配?比方说,如果前6位数字匹配,然后合并?
d1=pd.DataFrame({'ID':['00846U10','01381710'],
'count':[100,200]})
d2=pd.DataFrame({'ID2':['00846U101','013817101','02376R102'],
'value':[1,5,6]})
预处理ID和ID2只保留6个字符,不会那么工作! –
@GauravDhama它不会处理我所有的情况。更新了问题 – Lisa
因此,您想要将“ID”和“ID2”都分成6个数字,如果匹配,则合并两个数据框? –