我有一个数据帧,如果在另一个数据帧中存在匹配的值,我不想添加具有某种状态的列。我目前的代码工作: df1['NewColumn'] = df1['ComparisonColumn'].apply(lambda x: 'Match' if any(df2.ComparisonColumn == x) else ('' if x is None else 'Missing'))
我知道行是丑陋的,
我有一个大的循环,将花费太长时间(〜100天)。我希望能够通过雪库加快速度,但我并不擅长应用报表。这只是循环的一部分,但如果我能把这部分弄清楚,其余部分应该是直截了当的。我可以用一堆apply语句或循环,但是使用函数来获取对象'p'的应用语句将是理想的。 原始数据 dim(m1) == x x # x >>> 0
dim(m2) == y x # y >>> 0, y > x, y > x-10