0
请帮助从HTML标签中提取文本,我有以下HTML文本:使用Python正则表达式
Country/<i>List it here</i><br><font color="#ff00ff">Dubai</font><br><br>
我如何提取“迪拜”了上面的HTML吗?我有几百条这样的线,很急迫,所以没有研究BeautifulSoup或XML解析器的实现。
非常感谢!
请帮助从HTML标签中提取文本,我有以下HTML文本:使用Python正则表达式
Country/<i>List it here</i><br><font color="#ff00ff">Dubai</font><br><br>
我如何提取“迪拜”了上面的HTML吗?我有几百条这样的线,很急迫,所以没有研究BeautifulSoup或XML解析器的实现。
非常感谢!
既然你只是想要的东西快速和肮脏的,你可以使用:
re.match(r'.*>([^<>]*)</font>.*', s).group(1)
这只是抓住所有的非角brackety事情关闭字体标记之前。再次,不适合“真正的”解析。
太棒了,创造奇迹!谢谢! – ThinkCode 2010-11-02 22:10:34