0
因此我已经下载了网页的HTML。我应该从HTML中提取所有链接并输出它们。这里是我的代码如何从HTML中提取链接(使用python)
f = open('html.py','r')
heb = f.readlines()
arry = []
if 'href' in heb:
arry = arry.append(href)
print(arry)
我想做一个链接列表并输出它,但老实说我很迷路。有人能指引我朝着正确的方向吗?我想正则表达式可能是去 感谢
不要在HTML中使用正则表达式!使用像BeautifulSoup这样的HTML解析器。 – kevinsa5
[使用python和BeautifulSoup从网页检索链接]的可能的重复(https://stackoverflow.com/questions/1080411/retrieve-links-from-web-page-using-python-and-beautifulsoup) –