0
我有一个包含HTML的text
列的熊猫数据框。我想获得文本,也就是去掉标签。我尝试以下做法如下:熊猫:麻烦从DataFrame剥离HTML标签列
from bs4 import BeautifulSoup
result_df['text'] = BeautifulSoup(result_df['text']).get_text()
然而,我最终得到这个错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我在做什么错误?
谢谢!
确保应用lambda函数之前删除使用“df.dropna()”的所有丢失的数据,否则你将得到“类型错误:类型的对象浮动,如果你的数据“没有LEN()”错误帧缺少数据。 – sparrow