我一直在玩我的代码很长一段时间了。我想用由each_div
变量返回的值替换一串文本,该变量从网页返回一大堆解析值。Python如何从列表中的字符串中删除字符
def scrape_page():
create_dir(project_dir)
page = 1
max_page = 10
while page < max_page:
page = page + 1
for each_div in soup.find_all('div',{'class':'username'}):
f.write(str(each_div) + "\n")
如果我运行这段代码,它将解析来自html页面的用户名类的数据。问题是,它返回它是这样的:
<div class="username">someone_s_username</div>
我一直在试图待办事项是剥离<div class="username">
和</div>
部离开,因此将只返回实际的用户名,而不是HTML的。如果任何人对如何做到这一点,将是了不起的想法,谢谢
难道你不能直接引用所说的div的文本内容:'each_div.string' – schwobaseggl
大声笑,谢谢你甚至不知道.. – Naomi