0
我目前正在解析这个url。 Url将成为解析函数的参数。BeautifulSoup:提取标签之间的字符串似乎不工作
def parse(sitemap):
req = urllib.request.urlopen(sitemap)
soup = BeautifulSoup(req, 'lxml')
soup.prettify()
inventory_url = []
inventory_url_set = set()
for item in soup.find_all('url'):
print(item.find('lastmod'))
# print(item.find('lastmod').text)
inventory_url_set.add(item.find('loc').text)
然而,item.find('lastmod').text
retuns一个AttributeError,而如果我要打印整个标签item.find('lastmod')
它工作正常。
我只想从每个'item'中的'lastmod'标签之间获取文本。
感谢