我有一个包含说明列的数据框,我试图从该列中的文本中解析出测量值。在数据框中创建新列时保留缺失值空白
df['measurements'] = [re.findall('\S+\scm', i) + re.findall('\S+cm', i) for i in df['description'] if i is not None]
#...
description列中的一些行是空的,所以上面的代码给了我一个ValueError,因为值的长度与索引的长度不匹配。如果该行为空,那么如何追加一个像NaN这样的填充值,以便值的长度与索引的长度相匹配,并且可以创建新的度量值列?
输出看起来类似于: 例如。
description measurements
blabla 32cm x 24cm x 12cm blabla ['32cm', '24cm', '12cm']
NaN NaN
18cm x 15cm x 10cm blablabla ['18cm', '15cm', '10cm']
NaN NaN
你可以添加一些样本数据和期望的输出? – jezrael
我通过样品数据更改输出。 – jezrael