2012-03-29 134 views
-1

你如何使用Python和的HTMLParser模块提取锚标记属性(即href的值)。锚标记HREF提取

例如我有HTML代码,我需要解析它并使用文本找到锚标记的值。

+1

你尝试过什么吗?你的代码在哪里失败?的 – hochl 2012-03-29 10:56:13

+1

可能重复[我怎样才能从HTML代码的href链接](http://stackoverflow.com/questions/3075550/how-can-i-get-href-links-from-html-code) – Marcin 2012-03-29 12:24:31

回答

1

This question Stack Overflow上展示了如何提取与HTMLParser的链接。

但更方便的方法是使用BeautifulSoupthis question显示了一种方法来做到这一点。如果您希望更高级地抓取HTML内容,请查看BeautifulSoup的文档。