我想从这个网站拉角色名单,一旦我找到它Python3 BeautifulSoup返回串联字符串
actors_anchor = soup.find('a', href = re.compile('Actor&p'))
parent_tag = actors_anchor.parent
next_td_tag = actors_anchor_parent.findNext('td')
next_td_tag
<font size="2">Wes Bentley<br><a href="/people/chart/
?view=Actor&id=brycedallashoward.htm">Bryce Dallas Howard</a><br><a
href="/people/chart/?view=Actor&id=robertredford.htm">Robert
Redford</a><br><a href="/people/chart/ view=Actor&id=karlurban.htm">Karl Urban</a></br></br></br></font>
的问题是,当我拉文则会返回一个字符串名称之间没有空格
print(next_td_tag.get_text())
'''this returns'''
'Wes BentleyBryce Dallas HowardRobert RedfordKarl Urban'
我需要这些名称为每个名字就像 [“韦斯宾利”,“布莱斯·达拉斯·霍华德”,“罗伯特·雷德福”,“卡尔·厄本”]
分隔的列表任何建议都非常有用。
你不能使用'find_all('a',...)'和'for-loop'而没有'parent'和'findNext'吗? – furas
请详细说明。感谢您的格式编辑这是我的第一篇文章。 –
所以问题是,并非所有演员的名字都包含在一个标签html中的许多名称出现在
标签之间,当我使用该方法时,它不允许我获得'Wes Bentley' –