使用Python正则表达式

请帮助从HTML标签中提取文本，我有以下HTML文本：使用Python正则表达式

Country/<i>List it here</i><br><font color="#ff00ff">Dubai</font><br><br>

我如何提取“迪拜”了上面的HTML吗？我有几百条这样的线，很急迫，所以没有研究BeautifulSoup或XML解析器的实现。

非常感谢！

2010-11-02 ThinkCode

既然你只是想要的东西快速和肮脏的，你可以使用：

re.match(r'.*>([^<>]*)</font>.*', s).group(1)

这只是抓住所有的非角brackety事情关闭字体标记之前。再次，不适合“真正的”解析。

2010-11-02 21:27:10

太棒了，创造奇迹！谢谢！ – ThinkCode 2010-11-02 22:10:34

回答